top of page
Rechercher

La scienza dei dati è una vera scienza ?

  • Photo du rédacteur: Literature & Cie
    Literature & Cie
  • 4 mars 2021
  • 4 min de lecture

Poiché sento critiche su come la scienza dei dati sia non scientifica, vorrei chiarire che cos'è la scienza e mostrare come gli scienziati dei dati possano rispondere a queste critiche comuni sul loro campo.

Che cos'è la scienza ?

La scienza è una ricerca per raggiungere buone spiegazioni sul mondo. Come David Deutsch ha sottolineato nel suo libro, L'inizio dell'infinito, una buona spiegazione è chiara, precisa e difficile da variare.


Cos'è la scienza dei dati ?

La scienza dei dati è un nuovo campo scientifico che prospera per estrarre significato dai dati e migliorare la comprensione. Rappresenta un'evoluzione rispetto ad altre aree analitiche come le statistiche, l'analisi dei dati, la BI e così via.


La data science è emersa oggi grazie all'esplosione dei dati forniti da Internet, aumentando la potenza di calcolo con tecnologie più avanzate, lo sviluppo dell'informatica e algoritmi di apprendimento automatico.


Il termine data scientist è stato utilizzato per la prima volta da Jeff Hammerbacher e DJ Patil per descrivere un nuovo titolo di lavoro. Hanno cercato gli individui con una nuova serie di abilità critiche quali la matematica, la statistica, l'informatica, l'apprendimento automatico e la conoscenza di affari.


Perché la scienza dei dati non potrebbe mai essere una scienza « reale » ?

Critica : "L'analisi dei big data è principalmente: garbage in, garbage out... Quindi, come si può certificare la qualità dei dati e dei risultati ?".

In effetti, la nostra grande quantità di dati può essere riempita con errori ed errori. Ma, questa critica è rilevante anche per set di dati piccoli e medi. L'importante è come raccogliamo i dati e come li trattiamo. Faremo alcuni errori lungo la strada, ma per la maggior parte di essa, la scienza dei dati può affrontare i problemi della qualità dei dati, come ogni altro campo analitico.


Critica : « La scienza dei dati può trovare qualsiasi cosa in una grande quantità di dati. Suddividendo i dati e costruendo nuove funzionalità, possono dimostrare qualsiasi cosa. Come ha detto Ronald H. Coase : « Se torturate i dati abbastanza a lungo, confesserà. »

Un altro grande problema, ancora, superabile. Naturalmente, gli scienziati di dati devono stare attenti a non saltare a conclusioni troppo velocemente. Di nuovo, proprio come qualsiasi altra persona che cerca di raggiungere la verità. Nella scienza dei dati, abbiamo decine di metodi rigorosi per trattare i dati. Ad esempio, la cross-validazione e la regolarizzazione sono utili per non superare le proprie previsioni. Inoltre, possiamo pubblicare i nostri codici, e altri scienziati possono tracciare esattamente quello che abbiamo fatto con i dati dall'inizio alla fine.


Critica : « Gli scienziati dei dati possono costruire solo studi di osservazione. Potrebbero individuare alcune correlazioni, ma non possono dire nulla sulle cause sottostanti. »

La sperimentazione controllata con campioni casuali e gruppi di controllo è meglio per valutare la causalità. Ma in molti casi, sono costosi, immorali o addirittura impossibili da condurre. Per studiare correttamente i diversi fenomeni, la scienza ha bisogno sia di sperimentazioni controllate che di studi osservazionali.


Critica : « Ok per la scienza dei dati... Ma, la scienza dei dati aziendali non sarà mai una vera scienza. La scienza è impossibile negli affari perché le aziende cercano il denaro, non la verità scientifica. »

Anche se una separazione qui è rilevante, un data scientist che lavora in un'azienda può essere visto come scientifico come molti altri ricercatori che lavorano spesso nella ricerca e sviluppo. Infatti, un impegno per la realtà e la verità può portare un vantaggio competitivo duraturo per le imprese, e le scoperte scientifiche possono produrre benefici significativi.


Anche se queste critiche devono essere prese in considerazione da qualsiasi data scientist che cerca di raggiungere la conoscenza utilizzando i dati, non li condannano per essere scienziati falliti. Inoltre, queste critiche spesso mancano il punto, in quanto provengono da persone che non sanno molto sui metodi che usiamo per affrontare grandi quantità di dati.


Possiamo giudicare l'intero campo delle scienze dei dati ?

L'errore principale delle critiche di cui sopra è quello di giudicare l'intero campo della scienza dei dati in una sola volta e senza una reale comprensione di esso. Non può funzionare per nessun campo scientifico :

Alcuni medici non capiscono affatto le statistiche ; questo significa che il settore medico è non scientifico ? E diciamo che la medicina è destinata a non essere scientifica ?


Nel 2015, la psicologia è stata gravemente ferita da molte repliche sperimentali fallite. Concludiamo che tutti gli psicologi non sono scientifici e non lo saranno mai ?


Non possiamo giudicare un intero campo scientifico in una sola volta perché include molte persone non scientifiche tra quelle più scientifiche.


Alcuni scienziati dati sono finanziariamente motivati geek computer. Alcuni altri lavorano sodo per confermare eventuali intuizioni precedenti. La scienza dei dati deve affrontare questo e portare una cattiva reputazione in alcuni luoghi.


Ma, il campo di scienza dei dati inoltre ha avuto molti successi nella biologia, nella finanza, nel marketing e nell'economia. Inoltre, molte altre scoperte verranno dal nostro nuovo metodo per dare un senso a grandi quantità di dati, utilizzando algoritmi di apprendimento automatico o statistiche computazionali.


Un data scientist è un vero scienziato ?


"La scienza è un modo di pensare molto più che un corpo di conoscenze" - Carl Sagan.



Per trovare migliori spiegazioni sul mondo, gli scienziati fanno spazio per correggere gli errori nelle loro conoscenze precedenti. Cercano spiegazioni chiare, razionali e verificabili.

Gli scienziati dei dati devono sostenere questi principi scientifici e anche abbracciare valori scientifici come l'apertura alle idee, le critiche e il rispetto dell'opinione razionale dell’altro.


Quindi la prossima volta che vi state chiedendo se un campo è scientifico, scendete al livello individuale e vedete quanto quella persona rispetta l'epistemologia scientifica, i valori e il metodo. Per esempio si potrebbe chiedere, che cosa cerca di raggiungere ? Come sta mettendo in discussione la sua conoscenza ? Quali sono le sue principali fonti di fede ?





 
 
 

Posts récents

Voir tout

Commentaires


Post: Blog2_Post

Formulaire d'abonnement

Merci pour votre envoi !

©2020 par Literature & Cie. Créé avec Wix.com

bottom of page