Napriek tomu, že z metodického hľadiska sú IT a medicína od seba dosť vzdialené, je to tak
Ako sa koronavírus stal katalyzátorom pre dátovú vedu v medicíne
Dnes existujú dva kľúčové smeryaplikovaná aplikácia Data Science v medicíne - zdravotníctve a farmácii. Prvý smer zahŕňa diagnostické úlohy, optimalizáciu práce kliník a lekárov, výber liekov a liečby na základe diagnózy. Riešenia, ktoré sa používajú v každom z týchto globálnych problémov, sú založené na analýze údajov a algoritmoch strojového učenia. Nahromadené lekárske údaje sa aktívne využívajú pri vývoji liekov. Hovoríme tak o využití pri hľadaní účinných látok, ako aj o testovaní liekov na zvieratách a ľuďoch.
Osobitná úloha vo vývoji technológií Data Sciencehral pandémia koronavírusu. Potreba prediktívnych modelov, ktoré by mohli poskytnúť presnejšie údaje o budúcom šírení koronavírusu, prudko vzrástla: predpovedať počet hospitalizácií, vplyv určitých obmedzujúcich opatrení a očkovaní na COVID-19. A ak sú v klasickej epidemiológii takéto predpovede založené na relatívne jednoduchých epidemiologických modeloch, v skutočnosti sa tieto modely ukázali veľmi slabo, zatiaľ čo moderné metódy vedy o údajoch ich dokážu nahradiť a zlepšiť presnosť predpovedí.
Hlavné oblasti použitia dátovej vedy vmedicína počas pandémie zostala rovnaká, ale množstvo údajov a predpokladaný čas na vyriešenie problému sa výrazne zmenili. Napríklad úloha diagnostikovať ochorenie pomocou CT pľúc bola študovaná už dlho, na trhu existuje dostatočné množstvo pracovných riešení. Ale vďaka globálnemu charakteru pandémie, neustálej výmene údajov a ich dostupnosti bola úloha automatickej diagnostiky COVID-19 pomocou CT vyriešená čo najskôr. To isté platí pre predpovedanie závažnosti výsledku ochorenia, čo by mohlo pomôcť predpovedať počet dostupných nemocničných lôžok. Na vyriešenie tohto problému sa v niekoľkých krajinách paralelne zhromažďuje a analyzuje obrovské množstvo údajov. Ale špecifickosť medicíny je taká, že zavádzanie nových riešení je prakticky nemožné. Rovnako ako v prípade vakcín, je potrebné starostlivo otestovať akýkoľvek model, kým na ňom nebudú závisieť lekárske rozhodnutia.
Aké základné vedomosti sú potrebné pre prácu v Data Science:
- Vyššia matematika: lineárna algebra, matematická analýza, štatistika.
- Ako fungujú metódy strojového učenia.
Ako pomáha Data Science v boji proti rakovine, Alzheimerovej chorobe a novým drogám
Pozrime sa na rôzne oblasti použitiaDátová veda v medicíne. Jednou z najsľubnejších je diagnostika rakoviny. V súčasnosti dátoví vedci používajú na vývoj riešení v tejto oblasti celý rad algoritmov: výber konkrétnej metódy závisí od aktuálnej úlohy, dostupných údajov a ich objemu. Môžete napríklad urobiť diagnostiku pomocou obrázkov nádorov – v tomto prípade špecialisti Data Science s najväčšou pravdepodobnosťou použijú neurónové siete. Pre diagnostiku sa na základe výsledkov analýzy vyberie jedna z metód strojového učenia, ktorá je vhodnejšia pre konkrétnu úlohu. Existujú aj špecifické algoritmy používané napríklad na analýzu údajov DNA získaných z jednotlivých buniek. Takéto údaje sa najčastejšie analyzujú pomocou grafových algoritmov. Ale to je skôr výnimka z pravidla.
Okrem toho sa uplatňuje niekoľko metódvylepšiť obrázky a vylepšiť presnosť výsledku. Platformy pre veľké dáta (napríklad Hadoop) používajú napríklad MapReduce na vyhľadanie parametrov, ktoré je možné použiť pri rôznych úlohách. Pre tých, ktorí sa chystajú vyvinúť svoj vlastný produkt v tejto oblasti, alebo jednoducho pre nadšencov, existuje niekoľko otvorených súborov s údajmi o zobrazovaní mozgu: BrainWeb, IXI Dataset, fastMRI a OASIS.
Ďalším prípadom je modelovanie orgánovčlovek, jedna z najťažších technických úloh. Pri vývoji konkrétneho riešenia musí navyše špecialista presne pochopiť, prečo a na akej zložitosti sa orgán modeluje. Môžete napríklad vytvoriť model konkrétneho nádoru na úrovni génovej expresie a signálnych dráh. Spoločnosť Insilico Medicine dnes takéto problémy rieši. Tento prístup sa používa na nájdenie cieľa terapie vrátane metód Data Science. Takéto modely sa používajú hlavne na vedecký výskum, od praktickej aplikácie majú stále ďaleko.
Analýza génovej sekvencie - celásmer medicíny, ktorého vývoj je bez Data Science jednoducho nemožný. Ak sú programovacie schopnosti v jazyku Python v Data Science mimoriadne dôležité, potom práca s génmi vyžaduje aj znalosť programovacieho jazyka R a špecifických bioinformatických nástrojov - programov na prácu s DNA a proteínovými sekvenciami. Väčšina z týchto programov beží na operačnom systéme Unix a nie sú veľmi užívateľsky prívetivé. Aby ste ich zvládli, musíte minimálne porozumieť základom molekulárnej biológie a genetiky. Bohužiaľ, aj dnes na lekárskych fakultách existujú veľké problémy a väčšina lekárov má v skutočnosti zlú predstavu o tom, ako fungujú génové sekvencie. V Rusku pôsobia v tejto oblasti dve spoločnosti - Atlas a Genotech. Analýza mutácií jednotlivých génov je v súčasnosti tiež populárna. Takéto služby poskytuje väčšina veľkých spoločností poskytujúcich lekárske analýzy. Pacienti môžu napríklad zistiť, či majú predispozíciu na rakovinu prsníka v rovnakých génoch ako Angelina Jolie. Táto oblasť sa vyznačuje nedostatkom personálu, pretože je len málo miest, kde môžete získať príslušné vzdelanie. Mnohí navyše buď zostanú pracovať vo vede alebo odídu do zahraničia. Existuje niekoľko online zdrojov v ruštine, kde sa môžete dozvedieť takúto analýzu. Spravidla sú zamerané na lekárov alebo biológov a učia iba programovanie a základnú manipuláciu s údajmi. Ak chcete získať prístup k tejto oblasti zameraný na viac praxe, môžete absolvovať kurz na Fakulte dátových vied v medicíne v GeekBrains.
Dnes ich je na trhu niekoľkonástroje na analýzu dát v tejto oblasti: MapReduce, SQL, Galaxy, Bioconductor. MapReduce spracováva genetické údaje a skracuje čas potrebný na spracovanie genetických sekvencií.
SQL je jazyk relačnej databázy, ktorý používamesa používajú na zisťovanie a získavanie údajov z genomických databáz. Galaxy je aplikácia pre biomedicínsky výskum založená na otvorenom zdroji GUI. Umožňuje vám vykonávať rôzne operácie s genómami.
Bioconductor je softvér s otvoreným zdrojom určený na analýzu genomických údajov.
Dôležité komerčné a zároveňsmer výskumu - tvorba liekov novej generácie. Farmaceutickí špecialisti využívajú strojové učenie na hľadanie terapeutických cieľov a biomarkerov. Ani prvé, ani druhé, samozrejme, nie sú samotné drogy. Ciele sú molekuly v tele, s ktorými liek interaguje, a biomarkery sú molekuly, ktoré hovoria lekárovi, kto by mal liek použiť. Preto takmer všetky spoločnosti, ktoré vyvíjajú lieky na choroby s neznámymi cieľmi a biomarkermi – Novartis, Merck, Roche a ruský BIOCAD – využívajú strojové učenie. Sú to v prvom rade rakovina a autoimunitné ochorenia, Alzheimerova choroba. K tomu patrí aj hľadanie nových antibiotík.
Prečo lekári nepodporujú implementáciu dátovej vedy
Posledné roky ukázali, že Data Scienceje motorom odvetvia prediktívnych a analytických modelov v medicíne, napríklad pri aplikácii neurónových sietí na stanovenie priestorovej štruktúry proteínov. Pandémia však odhalila globálny problém v mnohých krajinách súvisiaci s optimalizáciou zdrojov kliniky a nedostatkom personálu. Za posledný rok sa objavilo veľa spoločností ponúkajúcich riešenia týchto problémov s Data Science. Využívanie údajov sa stalo veľkým prielomom pre súkromné kliniky, pretože zlacňuje lekárske služby. Na pozadí pandémie sa zvýšil aj dopyt po telemedicínskych službách, v ktorých sa bežne používajú algoritmy strojového učenia. Služby telemedicíny sú žiadané po predbežnej diagnostike, práci s analýzami a vytváraní chatovacích robotov.
Z hľadiska technologických obmedzeníaplikácia počítačového videnia a strojového učenia nemá prakticky žiadne prekážky. Hlbšia implementácia algoritmov a služieb závisí od túžby kliník a lekárov aplikovať metódy Data Science. Je tu tiež akútny nedostatok školiacich údajov, a to je problém nielen pre komerčné zdravotnícke zariadenia, ale aj pre štát: vlády by mali demokratizovať prístup k údajom z verejných nemocníc, aby vývojové spoločnosti mohli vytvárať moderné produkty.
Naučiť sa čo i len jeden program si vyžaduje veľakvalitatívne údaje. Aby sme sa naučili, ako rozlíšiť nádor v rámci, program potrebuje tisíce ručne analyzovaných obrazov pacientov a do analýzy by mali byť zapojení skúsení lekári.
Lekár musí najskôr nájsť nádor a až potomukáž, kde je. Ako si viete predstaviť, skúsených lekárov čaká ešte veľa ďalších vecí. Pandémia však napodiv pomohla niektorým oblastiam. Napríklad DiagnoCat, ruský startup, ktorý využíva počítačové videnie na analýzu snímok v zubnom lekárstve, dokázal prilákať neobsadených lekárov k analýze snímok počas uzamknutia. Pokiaľ ide o nechuť kliník a lekárov, lekári takýmto technológiám jednoducho nedôverujú. Dobrý lekár určite nájde taký prípad, keď program stanoví nesprávnu diagnózu, neskúsený lekár sa bojí, že program urobí všetko lepšie ako on. Vďaka tomu sa môžete kedykoľvek ospravedlniť starostlivosťou o pacienta a právnymi aspektmi.
Synergia dátovej vedy a lekárskych technológiíuž nám umožnil urobiť krok vpred vo vývoji riešení pre diagnostiku rakoviny, autoimunitných a neurodegeneratívnych chorôb. Služby založené na analýze dát a strojovom učení sú schopné predvídať šírenie vírusov a hľadať nové generácie liekov. Napriek tomu, že klasické lekárske vzdelávanie zaostáva za výzvami, ktorým dnešný priemysel čelí, je skutočné stať sa moderným špecialistom pôsobiacim na rozhraní dvoch vedných oblastí - Data Science a Medicine. A jedným zo spôsobov je online kurz na Fakulte dátových vied v medicíne v GeekBrains.
Pozri tiež:
Hmloviny, kométy a hviezdne škôlky: ukazujú najlepšiu astrofotografiu roku
Dáta zo špionážnych satelitov pomohli zistiť príčinu topenia ľadovcov v Ázii
Koronavírus v jaskyni: všetko o čínskych baníkoch, ktorí v roku 2012 utrpeli podivný zápal pľúc