Ondanks het feit dat ICT en geneeskunde vanuit methodologisch oogpunt nogal ver van elkaar verwijderd liggen, is dat wel het geval
Hoe coronavirus een katalysator werd voor datawetenschap in de geneeskunde
Tegenwoordig zijn er twee belangrijke richtingentoegepaste toepassing van Data Science in de geneeskunde - gezondheidszorg en farmacie. De eerste richting omvat diagnostische taken, optimalisatie van het werk van klinieken en artsen, selectie van medicijnen en behandelingen op basis van diagnose. De oplossingen die bij elk van deze mondiale problemen worden gebruikt, zijn gebaseerd op data-analyse en machine learning-algoritmen. Geaccumuleerde medische gegevens worden actief gebruikt bij de ontwikkeling van geneesmiddelen. We hebben het zowel over het gebruik bij de zoektocht naar werkzame stoffen als over het testen van medicijnen op dieren en mensen.
Een speciale rol in de ontwikkeling van Data Science-technologieëngespeeld door de coronapandemie. De behoefte aan voorspellende modellen die nauwkeurigere gegevens kunnen opleveren over de toekomstige verspreiding van het coronavirus is sterk toegenomen: om het aantal ziekenhuisopnames, de impact van bepaalde beperkende maatregelen en vaccinaties op COVID-19 te voorspellen. En als in de klassieke epidemiologie dergelijke voorspellingen gebaseerd zijn op relatief eenvoudige epidemiologische modellen, dan hebben deze modellen zich in werkelijkheid extreem slecht getoond, terwijl moderne Data Science-methoden in staat zijn om ze te vervangen en de nauwkeurigheid van voorspellingen te verbeteren.
De belangrijkste toepassingsgebieden van Data Science in:geneeskunde tijdens de pandemie hetzelfde gebleven, maar de hoeveelheid gegevens en de verwachte tijd om het probleem op te lossen zijn aanzienlijk veranderd. Zo is de taak van het diagnosticeren van een ziekte door middel van CT van de longen al lang onderzocht; er zijn voldoende werkende oplossingen op de markt. Maar dankzij het wereldwijde karakter van de pandemie, de constante uitwisseling van gegevens en hun beschikbaarheid, werd de taak van automatische diagnose van COVID-19 door CT zo snel mogelijk opgelost. Hetzelfde geldt voor het voorspellen van de ernst van de ziekte-uitkomst, wat zou kunnen helpen bij het voorspellen van het aantal beschikbare ziekenhuisbedden. Om dit probleem op te lossen, wordt in verschillende landen parallel een enorme hoeveelheid gegevens verzameld en geanalyseerd. Maar de specificiteit van de geneeskunde is zodanig dat de introductie van nieuwe oplossingen praktisch onmogelijk is. Net als bij vaccins is het zorgvuldig testen van elk model vereist voordat medische beslissingen ervan afhangen.
Welke basiskennis is vereist om in Data Science te werken:
- Hogere wiskunde: lineaire algebra, wiskundige analyse, statistiek.
- Hoe machine learning-methoden werken.
Hoe datawetenschap kanker, de ziekte van Alzheimer en nieuwe medicijnen helpt te bestrijden New
Laten we eens kijken naar verschillende toepassingsgebiedenDatawetenschap in de geneeskunde. Een van de meest veelbelovende is de diagnose van kanker. Tegenwoordig gebruiken datawetenschappers een hele reeks algoritmen om oplossingen op dit gebied te ontwikkelen: de keuze voor een specifieke methode hangt af van de taak die moet worden uitgevoerd, de gegevens die beschikbaar zijn en de omvang ervan. Je kunt bijvoorbeeld diagnostiek doen met behulp van tumorbeelden; in dit geval zullen Data Science-specialisten hoogstwaarschijnlijk gebruik maken van neurale netwerken. Voor diagnostiek zal op basis van de analyseresultaten een van de machine learning-methoden worden geselecteerd die beter geschikt is voor een specifieke taak. Er worden ook specifieke algoritmen gebruikt om bijvoorbeeld DNA-gegevens uit afzonderlijke cellen te analyseren. Dergelijke gegevens worden meestal geanalyseerd met behulp van grafiekalgoritmen. Maar dit is eerder een uitzondering op de regel.
Daarnaast zijn er verschillende methoden toegepastom afbeeldingen te verbeteren en de nauwkeurigheid van het resultaat te verbeteren. Big data-platforms (zoals Hadoop) gebruiken bijvoorbeeld MapReduce om parameters te vinden die bij verschillende taken kunnen worden gebruikt. Voor degenen die hun eigen product op dit gebied gaan ontwikkelen, of gewoon voor liefhebbers, zijn er verschillende open brain imaging datasets: BrainWeb, IXI Dataset, fastMRI en OASIS.
Een ander geval is orgelmodelleringmens, een van de moeilijkste technische taken. Bovendien moet de specialist bij het ontwikkelen van deze of gene oplossing precies begrijpen waarom en op welk niveau van complexiteit het orgel wordt gemodelleerd. Je kunt bijvoorbeeld een model maken van een specifieke tumor op het niveau van genexpressie en signaalroutes. Tegenwoordig lost het bedrijf Insilico Medicine dergelijke problemen op. Deze benadering wordt gebruikt om het doelwit van therapie te vinden, onder meer door middel van Data Science-methoden. Dergelijke modellen worden vooral gebruikt voor wetenschappelijk onderzoek, ze zijn nog verre van praktische toepassing.
Gensequentieanalyse - geheeleen richting van de geneeskunde, waarvan de ontwikkeling zonder Data Science simpelweg onmogelijk is. Als Python-programmeervaardigheden enorm belangrijk zijn in Data Science, dan vereist het werken met genen ook kennis van de R-programmeertaal en specifieke bioinformatica-tools - programma's voor het werken met DNA- en eiwitsequenties. De meeste van deze programma's draaien op het Unix-besturingssysteem en zijn niet erg gebruiksvriendelijk. Om ze onder de knie te krijgen, moet je op zijn minst de basis van moleculaire biologie en genetica begrijpen. Helaas zijn er tegenwoordig zelfs in medische scholen grote problemen mee, en de meeste artsen hebben eigenlijk een slecht idee van hoe de gensequenties werken. In Rusland zijn twee bedrijven op dit gebied actief - Atlas en Genotech. Analyse voor mutaties van individuele genen is op dit moment ook populair. De meeste grote medische analysebedrijven bieden dergelijke diensten aan. Patiënten kunnen er bijvoorbeeld achter komen of ze aanleg hebben voor borstkanker in dezelfde genen als Angelina Jolie. Dit gebied wordt gekenmerkt door een tekort aan personeel, aangezien er maar weinig plekken zijn waar je passend onderwijs kunt krijgen. Bovendien blijven velen ofwel werken in de wetenschap of gaan naar het buitenland. Er zijn maar weinig online bronnen in het Russisch waar u een dergelijke analyse kunt leren. Ze zijn meestal gericht op artsen of biologen en leren alleen programmeren en elementaire gegevensmanipulatie. Om een meer praktijkgerichte opleiding te krijgen met toegang tot dit gebied, kun je een cursus volgen aan de Faculteit Data Science in Medicine bij GeekBrains.
Er zijn er tegenwoordig meerdere op de markttools voor data-analyse op dit gebied: MapReduce, SQL, Galaxy, Bioconductor. MapReduce verwerkt genetische gegevens en verkort de tijd die nodig is om genetische sequenties te verwerken.
SQL is de relationele databasetaal die weworden gebruikt voor het opvragen en ophalen van gegevens uit genomische databases. Galaxy is een open source GUI-gebaseerde biomedische onderzoekstoepassing. Hiermee kunt u verschillende bewerkingen met genomen uitvoeren.
Ten slotte is Bioconductor een open source software die is ontworpen voor de analyse van genomische gegevens.
Belangrijk commercieel en tegelijkertijdonderzoeksrichting - de creatie van nieuwe generatie medicijnen. Farmaceutische specialisten gebruiken machine learning om therapeutische doelen en biomarkers te zoeken. Noch de eerste, noch de tweede zijn natuurlijk de medicijnen zelf. Doelwitten zijn moleculen in het lichaam waarmee een medicijn interageert, en biomarkers zijn moleculen die een arts vertellen wie het medicijn moet gebruiken. Daarom gebruiken bijna alle bedrijven die medicijnen ontwikkelen voor ziekten met onbekende doelwitten en biomarkers – Novartis, Merck, Roche en het Russische BIOCAD – machine learning. Dit zijn in de eerste plaats kanker en auto-immuunziekten, de ziekte van Alzheimer. Daar hoort ook de zoektocht naar nieuwe antibiotica bij.
Waarom artsen de implementatie van datawetenschap niet bevorderen?
De afgelopen jaren hebben aangetoond dat Data Scienceis de motor van de industrie van voorspellende en analytische modellen in de geneeskunde, bijvoorbeeld bij de toepassing van neurale netwerken om de ruimtelijke structuur van eiwitten te bepalen. Maar de pandemie heeft in veel landen een wereldwijd probleem blootgelegd dat verband houdt met de optimalisatie van de middelen van de kliniek en een gebrek aan personeel. Het afgelopen jaar zijn er veel bedrijven ontstaan die met Data Science oplossingen bieden voor deze problemen. Het gebruik van data is een grote doorbraak geworden voor privéklinieken, omdat het medische diensten goedkoper maakt. Tegen de achtergrond van de pandemie is ook de vraag naar telegeneeskundediensten toegenomen, waarbij machine learning-algoritmen veel worden gebruikt. Telemedicine-diensten zijn veelgevraagd voor een voorlopige diagnose, het werken met analyses en het maken van chatbots.
In termen van technologische beperkingende toepassing van computer vision en machine learning kent vrijwel geen barrières. Een diepere implementatie van algoritmen en diensten hangt af van de wens van klinieken en artsen om Data Science-methoden toe te passen. Er is ook een acuut tekort aan trainingsgegevens, en dit is niet alleen een probleem voor commerciële gezondheidszorginstellingen, maar ook voor de staat: regeringen moeten de toegang tot openbare ziekenhuisgegevens democratiseren, zodat ontwikkelingsbedrijven moderne producten kunnen maken.
Zelfs één programma leren vereist veelkwaliteitsgegevens. Om te leren hoe een tumor in een frame kan worden onderscheiden, heeft het programma duizenden handmatig geanalyseerde afbeeldingen van patiënten nodig, en ervaren artsen moeten bij de analyse worden betrokken.
De dokter moet eerst de tumor vinden, en danlaten zien waar ze is. Zoals u zich kunt voorstellen, hebben ervaren artsen nog veel meer te doen. Maar vreemd genoeg heeft de pandemie sommige gebieden geholpen. Zo wist DiagnoCat, een Russische startup die computervisie gebruikt om beelden in de tandheelkunde te analyseren, tijdens een lockdown onbezette artsen aan te trekken om beelden te analyseren. Wat betreft de terughoudendheid van klinieken en artsen, artsen vertrouwen dergelijke technologieën eenvoudigweg niet. Een goede arts zal zeker zo'n geval vinden wanneer het programma een verkeerde diagnose stelt, een onervaren arts is bang dat het programma alles beter zal doen dan hij. Hierdoor kunt u zich altijd verantwoorden door zorg te dragen voor de patiënt en juridische aspecten.
Synergie van datawetenschap en medische technologieënheeft al gezorgd voor een sprong voorwaarts in de ontwikkeling van oplossingen voor de diagnose van kanker, auto-immuunziekten en neurodegeneratieve ziekten. Diensten op basis van data-analyse en machine learning kunnen de verspreiding van virussen voorspellen en nieuwe generaties medicijnen zoeken. Ondanks het feit dat de klassieke medische opleiding achterblijft bij de uitdagingen waarmee de industrie vandaag de dag wordt geconfronteerd, is het echt om een moderne specialist te worden die werkt op het kruispunt van twee wetenschappelijke gebieden - Data Science en Medicine. En een manier is de online cursus bij de Faculty of Data Science in Medicine bij GeekBrains.
Zie ook:
Nevels, kometen en sterrenkraamkamers: de beste astrofotografie van het jaar
Gegevens van spionagesatellieten hielpen de oorzaak van smeltende gletsjers in Azië te achterhalen
Coronavirus in een grot: alles over Chinese mijnwerkers die in 2012 last hadden van een vreemde longontsteking