Trots att IT och medicin ur metodsynpunkt ligger ganska långt ifrån varandra så är det det
Hur Coronavirus blev en katalysator för datavetenskap i medicin
Idag finns det två nyckelriktningartillämpad tillämpning av Data Science inom medicin - sjukvård och läkemedel. Den första inriktningen omfattar diagnostiska uppgifter, optimering av klinikers och läkares arbete, urval av mediciner och behandlingar baserade på diagnos. Lösningarna som används i vart och ett av dessa globala problem är baserade på dataanalys och maskininlärningsalgoritmer. Ackumulerade medicinska data används aktivt i läkemedelsutveckling. Vi pratar både om användning i sökandet efter aktiva substanser och testning av läkemedel på djur och människor.
En speciell roll i utvecklingen av datavetenskapsteknologierspelas av coronaviruspandemin. Behovet av prediktiva modeller som kan ge mer exakta uppgifter om den framtida spridningen av coronavirus har ökat kraftigt: att förutsäga antalet sjukhusvistelser, effekterna av vissa restriktiva åtgärder och vaccinationer på COVID-19. Och om sådana förutsägelser baseras på relativt enkla epidemiologiska modeller i klassisk epidemiologi, har dessa modeller i själva verket visat sig extremt dåligt, medan moderna datavetenskapliga metoder kan ersätta dem och förbättra förutsägelsernas noggrannhet.
De viktigaste användningsområdena för datavetenskap imedicinen under pandemin förblev densamma, men mängden data och den förväntade tiden för att lösa problemet har förändrats avsevärt. Till exempel har uppgiften att diagnostisera en sjukdom med CT i lungorna studerats länge; det finns tillräckligt många arbetslösningar på marknaden. Men tack vare pandemiens globala natur, det konstanta utbytet av data och deras tillgänglighet löstes uppgiften att automatiskt diagnostisera COVID-19 med CT så snart som möjligt. Detsamma gäller för att förutsäga svårighetsgraden av sjukdomsutfallet, vilket kan hjälpa till att förutsäga antalet tillgängliga sjukhussängar. För att lösa detta problem samlas och analyseras en enorm mängd data parallellt i flera länder. Men medicinens specificitet är sådan att införandet av nya lösningar är praktiskt taget omöjligt. Som med vacciner krävs noggrann testning av vilken modell som helst innan medicinska beslut beror på den.
Vilken grundläggande kunskap krävs för att arbeta inom datavetenskap:
- Högre matematik: linjär algebra, matematisk analys, statistik.
- Hur maskininlärningsmetoder fungerar.
Hur datavetenskap hjälper till att bekämpa cancer, Alzheimers och nya läkemedel
Låt oss titta på olika användningsområdenDatavetenskap inom medicin. En av de mest lovande är diagnosen cancer. Idag använder datavetare en hel rad algoritmer för att utveckla lösningar inom detta område: valet av en specifik metod beror på uppgiften, vilken data som är tillgänglig och dess volym. Till exempel kan du göra diagnostik med hjälp av tumörbilder - i det här fallet kommer Data Science-specialister med största sannolikhet att använda neurala nätverk. För diagnostik kommer, baserat på analysresultaten, en av de maskininlärningsmetoder att väljas ut som är bättre lämpad för en specifik uppgift. Det finns också specifika algoritmer som används, till exempel för att analysera DNA-data som erhållits från enstaka celler. Sådana data analyseras oftast med hjälp av grafalgoritmer. Men detta är snarare ett undantag från regeln.
Dessutom finns det flera metoder som användsför att förbättra bilder och förbättra resultatets noggrannhet. Big data-plattformar (som Hadoop) använder till exempel MapReduce för att hitta parametrar som kan användas i olika uppgifter. För dem som ska utveckla sin egen produkt inom detta område, eller bara entusiaster, finns det flera öppna hjärnbildningsdata: BrainWeb, IXI Dataset, fastMRI och OASIS.
Ett annat fall är orgelmodelleringmänsklig, en av de svåraste tekniska uppgifterna. Dessutom måste specialisten förstå exakt varför och på vilken komplexitetsnivå organet modelleras när han utvecklar den här eller den andra lösningen. Du kan till exempel skapa en modell av en specifik tumör på nivån för genuttryck och signalvägar. Idag löser företaget Insilico Medicine sådana problem. Detta tillvägagångssätt används för att hitta målet för terapi, inklusive genom datavetenskapliga metoder. Sådana modeller används främst för vetenskaplig forskning; de är fortfarande långt ifrån praktiska tillämpningar.
Gensekvensanalys - helheten riktning mot medicin, vars utveckling helt enkelt är omöjlig utan datavetenskap. Om Python-programmeringskunskaper är extremt viktiga inom datavetenskap, kräver arbetet med gener också kunskap om R-programmeringsspråket och specifika bioinformatikverktyg - program för att arbeta med DNA- och proteinsekvenser. De flesta av dessa program körs på Unix-operativsystemet och är inte särskilt användarvänliga. För att behärska dem måste du åtminstone förstå grunderna i molekylärbiologi och genetik. Tyvärr, även i medicinska skolor idag, finns det stora problem med detta, och de flesta läkare har faktiskt en dålig uppfattning om hur gensekvenser fungerar. I Ryssland är två företag engagerade inom detta område - Atlas och Genotech. Analys för mutationer av enskilda gener är också populärt just nu. De flesta stora medicinska analysföretag tillhandahåller sådana tjänster. Patienter kan till exempel ta reda på om de har en benägenhet för bröstcancer i samma gener som Angelina Jolie. Området kännetecknas av brist på personal, eftersom det bara finns ett fåtal platser där du kan få en lämplig utbildning. Dessutom stannar många antingen för att arbeta inom naturvetenskap eller åka utomlands. Det finns få rysskspråkiga online-resurser där du kan lära dig en sådan analys. De riktar sig vanligtvis till läkare eller biologer och undervisar bara i programmering och grundläggande datamanipulation. För att få en mer praktikorienterad utbildning med tillgång till detta område kan du genomföra en kurs vid fakulteten för datavetenskap i medicin vid GeekBrains.
Det finns flera på marknaden idagverktyg för dataanalys inom detta område: MapReduce, SQL, Galaxy, Bioconductor. MapReduce bearbetar genetisk data och minskar tiden som krävs för att bearbeta genetiska sekvenser.
SQL är det relationsdatabasspråk som vianvänds för att fråga och hämta data från genomiska databaser. Galaxy är en open source GUI-baserad biomedicinsk forskningsapplikation. Det låter dig utföra olika operationer med genom.
Slutligen är Bioconductor en programvara med öppen källkod utformad för analys av genomdata.
Viktigt kommersiellt och samtidigtforskningsriktning - skapandet av nya generationens läkemedel. Läkemedelsspecialister använder maskininlärning för att söka efter terapeutiska mål och biomarkörer. Varken den första eller den andra är förstås själva drogerna. Mål är molekyler i kroppen som ett läkemedel interagerar med, och biomarkörer är molekyler som talar om för en läkare vem som ska använda läkemedlet. Därför använder nästan alla företag som utvecklar läkemedel för sjukdomar med okända mål och biomarkörer – Novartis, Merck, Roche och ryska BIOCAD – maskininlärning. Dessa är för det första cancer och autoimmuna sjukdomar, Alzheimers sjukdom. Detta inkluderar även sökandet efter nya antibiotika.
Varför läkare inte främjar datavetenskaplig implementering
De senaste åren har visat att datavetenskapär motorn i branschen för prediktiva och analytiska modeller inom medicin, till exempel i tillämpningen av neurala nätverk för att bestämma proteinstrukturen. Men pandemin har avslöjat ett globalt problem i många länder relaterat till optimering av klinikresurser och brist på personal. Under det senaste året har många företag dykt upp som erbjuder lösningar på dessa problem med Data Science. Användningen av data har blivit ett stort genombrott för privata kliniker, eftersom det gör medicinska tjänster billigare. Mot bakgrund av pandemin har efterfrågan på telemedicinstjänster också ökat, där maskininlärningsalgoritmer används i stor utsträckning. Telemedicinstjänster efterfrågas för en preliminär diagnos, arbetar med analyser och skapar chattbots.
När det gäller tekniska begränsningartillämpningen av datorseende och maskininlärning har praktiskt taget inga hinder. Djupare implementering av algoritmer och tjänster beror på klinikers och läkares vilja att tillämpa Data Science-metoder. Det råder också en akut brist på utbildningsdata, och detta är en fråga inte bara för kommersiella vårdinstitutioner, utan också för staten: regeringar bör demokratisera tillgången till offentliga sjukhusdata så att utvecklingsföretag kan skapa moderna produkter.
Att lära sig ett program kräver mycketkvalitetsdata. För att lära sig att skilja en tumör i en ram, kräver programmet tusentals manuellt analyserade bilder av patienter, och erfarna läkare bör involveras i analysen.
Läkaren måste först hitta tumören och sedanvisa var hon är. Som du kan föreställa dig har erfarna läkare många andra saker att göra. Men pandemin har, konstigt nog, hjälpt vissa områden. Till exempel kunde DiagnoCat, en rysk start som använder datorsyn för att analysera bilder inom tandvården, locka lediga läkare att analysera bilder under en låsning. När det gäller motvillighet från kliniker och läkare litar läkare helt enkelt inte på sådan teknik. En bra läkare kommer säkert att hitta ett sådant fall när programmet gör en fel diagnos, en oerfaren läkare är rädd att programmet kommer att göra allt bättre än honom. Som ett resultat kan du alltid rättfärdiga dig själv genom att ta hand om patientens och juridiska aspekter.
Synergi för datavetenskap och medicinsk teknikhar redan gjort ett steg framåt i utvecklingen av lösningar för diagnos av cancer, autoimmuna och neurodegenerativa sjukdomar. Tjänster som drivs av dataanalys och maskininlärning kan förutsäga spridningen av virus och leta efter nya generationer av läkemedel. Trots att klassisk medicinsk utbildning ligger efter de utmaningar som industrin står inför idag är det verkligt att bli en modern specialist som arbetar vid korsningen av två vetenskapliga områden - Datavetenskap och medicin. Och ett sätt är online-kursen vid fakulteten för datavetenskap i medicin vid GeekBrains.
Se även:
Nebulosor, kometer och stjärnplantskolor: visar årets bästa astrofotografi
Data från spionattsatelliter hjälpte till att ta reda på orsaken till smältande glaciärer i Asien
Coronavirus i en grotta: allt om kinesiska gruvarbetare som led av konstig lunginflammation 2012