Data Science in medicina: chi, come e perché elabora i dati

Nonostante il fatto che, da un punto di vista metodologico, l'informatica e la medicina siano piuttosto distanti tra loro.amico, è

La biologia e la ricerca medica hanno portato avanti l'analisi dei dati e l'applicazione di vari modelli analitici.Oggi, anche negli istituti medici, nei corsi di statistica medica, si studiano le basi della Data Science.E sebbene questi metodi siano chiamati in modo diverso nelle università di medicina, è abbastanza difficile per i medici applicarli a causa della mancanza di esperienza nella programmazione.La capacità di programmare è la prima cosa che viene richiesta a uno specialista in questo campo.È necessario comprendere i moderni algoritmi di analisi dei dati: le reti neurali.E non solo per capire teoricamente come funziona l'algoritmo, ma per fare questo, è necessario avere una buona padronanza della matematica superiore ed essere in grado di utilizzare questi algoritmi su dati medici reali.Questo, a sua volta, richiede la conoscenza di speciali strumenti di data science, come le librerie Python e i metodi di pre-elaborazione dei dati.

Come il coronavirus è diventato un catalizzatore per la scienza dei dati in medicina

Oggi ci sono due direzioni chiaveapplicazione applicata della Data Science in ambito medico-sanitario e farmaceutico. La prima direzione comprende compiti diagnostici, ottimizzazione del lavoro di cliniche e medici, selezione di farmaci e trattamenti basati sulla diagnosi. Le soluzioni utilizzate in ciascuno di questi problemi globali si basano sull’analisi dei dati e su algoritmi di apprendimento automatico. I dati medici accumulati vengono utilizzati attivamente nello sviluppo di farmaci. Parliamo sia dell'utilizzo nella ricerca di principi attivi che della sperimentazione di farmaci su animali e uomo.

Un ruolo speciale nello sviluppo delle tecnologie di Data Sciencegiocato dalla pandemia di coronavirus. La necessità di modelli predittivi che possano fornire dati più accurati sulla futura diffusione del coronavirus è fortemente aumentata: prevedere il numero di ricoveri, l'impatto di alcune misure restrittive e vaccinazioni su COVID-19. E se nell'epidemiologia classica tali previsioni si basano su modelli epidemiologici relativamente semplici, allora in realtà questi modelli si sono mostrati estremamente male, mentre i moderni metodi di Data Science sono in grado di sostituirli e migliorare l'accuratezza delle previsioni.

I principali ambiti di applicazione della Data Science inla medicina durante la pandemia è rimasta la stessa, ma la quantità di dati e il tempo previsto per risolvere il problema sono cambiati in modo significativo. Ad esempio, il compito di diagnosticare una malattia mediante TC dei polmoni è stato studiato a lungo; sul mercato esiste un numero sufficiente di soluzioni funzionanti. Ma grazie alla natura globale della pandemia, al costante scambio di dati e alla loro disponibilità, il compito della diagnosi automatica di COVID-19 mediante TC è stato risolto il prima possibile. Lo stesso vale per la previsione della gravità dell'esito della malattia, che potrebbe aiutare a prevedere il numero di letti ospedalieri disponibili. Per risolvere questo problema, viene raccolta e analizzata un'enorme quantità di dati in diversi paesi in parallelo. Ma la specificità della medicina è tale che l'introduzione di nuove soluzioni è praticamente impossibile. Come per i vaccini, è necessario un attento test di qualsiasi modello prima che le decisioni mediche dipendano da esso.

Quali conoscenze di base sono necessarie per lavorare in Data Science:

  • Matematica superiore: algebra lineare, analisi matematica, statistica.
  • Come funzionano i metodi di apprendimento automatico.

Come la scienza dei dati aiuta a combattere il cancro, l'Alzheimer e i nuovi farmaci New

Diamo un'occhiata ai vari ambiti di applicazioneScienza dei dati in medicina. Uno dei più promettenti è la diagnosi del cancro. Oggi i data scientist utilizzano tutta una serie di algoritmi per sviluppare soluzioni in questo ambito: la scelta di un metodo specifico dipende dal compito da svolgere, dai dati disponibili e dal loro volume. Ad esempio, puoi effettuare la diagnostica utilizzando le immagini del tumore: in questo caso, gli specialisti di Data Science molto probabilmente utilizzeranno le reti neurali. Per la diagnostica, in base ai risultati dell'analisi, verrà selezionato uno dei metodi di machine learning più adatto per un'attività specifica. Esistono anche algoritmi specifici utilizzati, ad esempio, per analizzare i dati del DNA ottenuti da singole cellule. Tali dati vengono spesso analizzati utilizzando algoritmi grafici. Ma questa è piuttosto un'eccezione alla regola.

Inoltre, ci sono diversi metodi applicatiper migliorare le immagini e migliorare l'accuratezza del risultato. Le piattaforme Big Data (come Hadoop) utilizzano, ad esempio, MapReduce per trovare parametri che possono essere utilizzati in varie attività. Per coloro che svilupperanno il proprio prodotto in quest'area, o semplicemente per gli appassionati, ci sono diversi set di dati di imaging cerebrale aperti: BrainWeb, IXI Dataset, fastMRI e OASIS.

Un altro caso è la modellazione di organiumano, uno dei compiti tecnici più difficili. Inoltre, nello sviluppo di questa o quella soluzione, lo specialista deve capire esattamente perché ea quale livello di complessità viene modellato l'organo. Ad esempio, puoi creare un modello di un tumore specifico a livello di espressione genica e vie di segnalazione. Oggi l'azienda Insilico Medicine sta risolvendo questi problemi. Questo approccio viene utilizzato per trovare il target della terapia, anche con metodi di Data Science. Tali modelli sono utilizzati principalmente per la ricerca scientifica e sono ancora lontani dall'applicazione pratica.

Analisi della sequenza genica - interouna direzione della medicina, il cui sviluppo è semplicemente impossibile senza Data Science. Se le abilità di programmazione in Python sono estremamente importanti nella Data Science, allora lavorare con i geni richiede anche la conoscenza del linguaggio di programmazione R e di strumenti bioinformatici specifici - programmi per lavorare con sequenze di DNA e proteine. La maggior parte di questi programmi gira sul sistema operativo Unix e non è molto user-friendly. Per padroneggiarli, devi almeno comprendere le basi della biologia molecolare e della genetica. Sfortunatamente, anche nelle scuole di medicina di oggi, ci sono grossi problemi con questo, e la maggior parte dei medici in realtà ha una scarsa idea di come funzionano le sequenze geniche. In Russia, due società sono impegnate in questo settore: Atlas e Genotech. Anche l'analisi delle mutazioni di singoli geni è molto popolare al momento. La maggior parte delle grandi società di analisi mediche fornisce tali servizi. I pazienti, ad esempio, possono scoprire se hanno una predisposizione al cancro al seno negli stessi geni di Angelina Jolie. Questa zona è caratterizzata da una carenza di personale, poiché ci sono solo pochi luoghi dove è possibile ottenere un'istruzione adeguata. Inoltre, molti rimangono per lavorare nella scienza o vanno all'estero. Ci sono poche risorse online in lingua russa dove puoi imparare una simile analisi. Di solito sono rivolti a medici o biologi e insegnano solo la programmazione e la manipolazione dei dati di base. Per ottenere un'istruzione più orientata alla pratica con l'accesso a quest'area, è possibile completare un corso presso la Facoltà di Scienze dei dati in Medicina presso GeekBrains.

Oggi ce ne sono diversi sul mercatostrumenti per l'analisi dei dati in quest'area: MapReduce, SQL, Galaxy, Bioconductor. MapReduce elabora i dati genetici e riduce il tempo necessario per elaborare le sequenze genetiche.

SQL è il linguaggio del database relazionale che noivengono utilizzati per interrogare e recuperare dati da database genomici. Galaxy è un'applicazione di ricerca biomedica basata su GUI open source. Ti consente di eseguire varie operazioni con i genomi.

Infine, Bioconductor è un software open source progettato per l'analisi dei dati genomici.

Commerciale importante e allo stesso tempodirezione della ricerca: la creazione di farmaci di nuova generazione. Gli specialisti farmaceutici utilizzano l'apprendimento automatico per cercare bersagli terapeutici e biomarcatori. Né il primo né il secondo, ovviamente, sono i farmaci stessi. I bersagli sono molecole nel corpo con cui interagisce un farmaco e i biomarcatori sono molecole che dicono al medico chi dovrebbe usare il farmaco. Pertanto, quasi tutte le aziende che sviluppano farmaci per malattie con bersagli e biomarcatori sconosciuti - Novartis, Merck, Roche e la russa BIOCAD - utilizzano l'apprendimento automatico. Questi sono, prima di tutto, il cancro e le malattie autoimmuni, il morbo di Alzheimer. Ciò include anche la ricerca di nuovi antibiotici.

Perché i medici non promuovono l'implementazione della scienza dei dati

Gli ultimi anni hanno dimostrato che la Data Scienceè il motore dell'industria dei modelli predittivi e analitici in medicina, ad esempio nell'applicazione delle reti neurali per determinare la struttura spaziale delle proteine. Ma la pandemia ha messo in luce un problema globale in molti paesi legato all'ottimizzazione delle risorse della clinica e alla mancanza di personale. Nell'ultimo anno, molte aziende sono nate offrendo soluzioni a questi problemi con Data Science. L'uso dei dati è diventato un grande passo avanti per le cliniche private, poiché rende i servizi medici più economici. Sullo sfondo della pandemia, è aumentata anche la domanda di servizi di telemedicina, in cui sono ampiamente utilizzati algoritmi di machine learning. I servizi di telemedicina sono richiesti per la diagnosi preliminare, il lavoro con le analisi e la creazione di chat bot.

In termini di limiti tecnologicil’applicazione della visione artificiale e dell’apprendimento automatico non ha praticamente barriere. Un’implementazione più approfondita di algoritmi e servizi dipende dal desiderio delle cliniche e dei medici di applicare i metodi della scienza dei dati. C’è anche una grave carenza di dati sulla formazione, e questo è un problema non solo per le istituzioni sanitarie commerciali, ma anche per lo Stato: i governi dovrebbero democratizzare l’accesso ai dati degli ospedali pubblici in modo che le società di sviluppo possano creare prodotti moderni.

Imparare anche un solo programma richiede moltodati di qualità. Per imparare a distinguere un tumore in una cornice, il programma ha bisogno di migliaia di immagini di pazienti analizzate manualmente e medici esperti dovrebbero essere coinvolti nell'analisi.

Il dottore deve prima trovare il tumore, e poimostra dov'è. Come puoi immaginare, i medici esperti hanno molte altre cose da fare. Ma la pandemia, stranamente, ha aiutato alcune aree. Ad esempio, DiagnoCat, una startup russa che utilizza la visione artificiale per analizzare le immagini in odontoiatria, è stata in grado di attirare medici non occupati per analizzare le immagini durante un blocco. Per quanto riguarda la riluttanza di cliniche e medici, i medici semplicemente non si fidano di tali tecnologie. Un buon medico troverà sicuramente un caso del genere quando il programma fa una diagnosi sbagliata, un medico inesperto ha paura che il programma farà tutto meglio di lui. Di conseguenza, puoi sempre giustificarti prendendoti cura del paziente e degli aspetti legali.

Sinergia di scienza dei dati e tecnologie medicheci ha già permesso di fare un balzo in avanti nello sviluppo di soluzioni per la diagnosi dei tumori, delle malattie autoimmuni e neurodegenerative. I servizi basati sull'analisi dei dati e sull'apprendimento automatico sono in grado di prevedere la diffusione dei virus e cercare nuove generazioni di farmaci. Nonostante il fatto che l'educazione medica classica sia in ritardo rispetto alle sfide che l'industria deve affrontare oggi, è reale diventare uno specialista moderno che lavora all'incrocio di due campi scientifici: la scienza dei dati e la medicina. E un modo è il corso online presso la Facoltà di Scienze dei dati in Medicina di GeekBrains.

Vedi anche:

Nebulose, comete e vivai stellari: in mostra la migliore astrofotografia dell'anno

I dati dei satelliti spia hanno aiutato a scoprire la causa dello scioglimento dei ghiacciai in Asia

Coronavirus in una grotta: tutto sui minatori cinesi che hanno sofferto di una strana polmonite nel 2012