I přes to, že z metodologického hlediska jsou si IT a medicína dost daleko, je to tak
Jak se koronavirus stal katalyzátorem pro datovou vědu v medicíně
Dnes existují dva klíčové směryaplikovaná aplikace Data Science v medicíně - zdravotnictví a farmacii. První směr zahrnuje diagnostické úkoly, optimalizaci práce klinik a lékařů, výběr léků a léčby na základě diagnózy. Řešení, která se používají v každém z těchto globálních problémů, jsou založena na analýze dat a algoritmech strojového učení. Nashromážděná lékařská data se aktivně využívají při vývoji léků. Hovoříme jak o využití při hledání účinných látek, tak o testování léků na zvířatech a lidech.
Zvláštní role ve vývoji technologií Data Sciencehrál pandemií koronaviru. Potřeba prediktivních modelů, které by mohly poskytnout přesnější údaje o budoucím šíření koronaviru, prudce vzrostla: předpovědět počet hospitalizací, dopad určitých omezujících opatření a očkování na COVID-19. A pokud jsou v klasické epidemiologii takové předpovědi založeny na relativně jednoduchých epidemiologických modelech, pak se ve skutečnosti tyto modely ukázaly extrémně špatně, zatímco moderní metody Data Science jsou schopné je nahradit a zlepšit přesnost předpovědí.
Hlavní oblasti aplikace Data Science vlék během pandemie zůstal stejný, ale množství dat a očekávaný čas k vyřešení problému se významně změnily. Například úkol diagnostikovat onemocnění pomocí CT plic byl studován po dlouhou dobu; na trhu existuje dostatečný počet pracovních řešení. Ale díky globální povaze pandemie, neustálé výměně dat a jejich dostupnosti byl úkol automatické diagnostiky COVID-19 pomocí CT vyřešen co nejdříve. Totéž platí pro predikci závažnosti výsledku onemocnění, což by mohlo pomoci předpovědět počet dostupných nemocničních lůžek. K vyřešení tohoto problému je v několika zemích souběžně shromažďováno a analyzováno obrovské množství dat. Specifičnost medicíny je však taková, že zavádění nových řešení je prakticky nemožné. Stejně jako u vakcín je nutné pečlivě otestovat jakýkoli model, než na něm bude záviset lékařská rozhodnutí.
Jaké základní znalosti jsou vyžadovány pro práci v Data Science:
- Vyšší matematika: lineární algebra, matematická analýza, statistika.
- Jak fungují metody strojového učení.
Jak datová věda pomáhá v boji proti rakovině, Alzheimerově chorobě a novým drogám
Podívejme se na různé oblasti použitíData Science in Medicine. Jednou z nejslibnějších je diagnostika rakoviny. Dnes datoví vědci používají k vývoji řešení v této oblasti celou řadu algoritmů: výběr konkrétní metody závisí na daném úkolu, dostupných datech a jejich objemu. Diagnostiku můžete provádět například pomocí snímků nádorů – v tomto případě specialisté Data Science s největší pravděpodobností použijí neuronové sítě. Pro diagnostiku bude na základě výsledků analýzy vybrána jedna z metod strojového učení, která se lépe hodí pro konkrétní úlohu. Existují také specifické algoritmy používané například pro analýzu dat DNA získaných z jednotlivých buněk. Taková data se nejčastěji analyzují pomocí grafových algoritmů. Ale to je spíše výjimka z pravidla.
Kromě toho se používá několik metodvylepšit obrázky a zlepšit přesnost výsledku. Velké datové platformy (například Hadoop) používají například MapReduce k vyhledání parametrů, které lze použít v různých úkolech. Pro ty, kteří se chystají vyvinout vlastní produkt v této oblasti, nebo jednoduše pro nadšence, existuje několik otevřených datových sad pro zobrazování mozku: BrainWeb, IXI Dataset, fastMRI a OASIS.
Dalším případem je modelování orgánůčlověk, jeden z nejobtížnějších technických úkolů. Při vývoji tohoto nebo toho řešení musí navíc odborník přesně pochopit, proč a na jaké úrovni složitosti se orgán modeluje. Můžete například vytvořit model konkrétního nádoru na úrovni genové exprese a signálních drah. Společnost Insilico Medicine dnes řeší tyto problémy. Tento přístup se používá k nalezení cíle terapie, včetně metod Data Science. Takové modely se používají hlavně pro vědecký výzkum; od praktické aplikace mají stále daleko.
Analýza genové sekvence - celásměr medicíny, jehož vývoj je bez Data Science jednoduše nemožný. Pokud jsou dovednosti programování v Pythonu v Data Science nesmírně důležité, pak práce s geny také vyžaduje znalost programovacího jazyka R a specifických bioinformatických nástrojů - programů pro práci s DNA a proteinovými sekvencemi. Většina z těchto programů běží na operačním systému Unix a není příliš uživatelsky přívětivá. Abyste je zvládli, musíte alespoň porozumět základům molekulární biologie a genetiky. Bohužel i dnes na lékařských fakultách s tím existují velké problémy a většina lékařů má ve skutečnosti špatnou představu o tom, jak fungují genové sekvence. V Rusku se v této oblasti zabývají dvě společnosti - Atlas a Genotech. Analýza mutací jednotlivých genů je v současnosti také populární. Většina velkých společností poskytujících lékařské analýzy takové služby poskytuje. Pacienti mohou například zjistit, zda mají predispozici k rakovině prsu ve stejných genech jako Angelina Jolie. Tato oblast se vyznačuje nedostatkem personálu, protože existuje jen několik míst, kde můžete získat odpovídající vzdělání. Mnozí navíc buď zůstávají pracovat ve vědě, nebo jdou do zahraničí. Existuje několik online zdrojů v ruštině, kde se můžete takovou analýzu naučit. Obvykle jsou zaměřeny na lékaře nebo biology a učí pouze programování a základní manipulaci s daty. Chcete-li získat přístup k této oblasti více zaměřený na praxi, můžete absolvovat kurz na Fakultě datových věd v medicíně v GeekBrains.
Dnes je jich na trhu několiknástroje pro analýzu dat v této oblasti: MapReduce, SQL, Galaxy, Bioconductor. MapReduce zpracovává genetická data a zkracuje čas potřebný ke zpracování genetických sekvencí.
SQL je jazyk relační databáze, který myse používají k vyhledávání a načítání dat z genomových databází. Galaxy je open source aplikace pro biomedicínský výzkum založená na grafickém uživatelském rozhraní. Umožňuje provádět různé operace s genomy.
A konečně, Bioconductor je open source software určený pro analýzu genomických dat.
Důležitá komerční a zároveňsměr výzkumu - tvorba léků nové generace. Farmaceutickí specialisté používají strojové učení k hledání terapeutických cílů a biomarkerů. Ani první, ani druhé samozřejmě nejsou samotné drogy. Cíle jsou molekuly v těle, se kterými lék interaguje, a biomarkery jsou molekuly, které říkají lékaři, kdo by měl lék použít. Strojové učení proto využívají téměř všechny společnosti, které vyvíjejí léky na nemoci s neznámými cíli a biomarkery – Novartis, Merck, Roche i ruský BIOCAD. Jsou to především rakovina a autoimunitní onemocnění, Alzheimerova choroba. Patří sem i hledání nových antibiotik.
Proč lékaři nepodporují implementaci datové vědy
Poslední roky ukázaly, že Data Scienceje motorem průmyslu prediktivních a analytických modelů v medicíně, například při aplikaci neuronových sítí k určení prostorové struktury proteinů. Pandemie však odhalila v mnoha zemích globální problém související s optimalizací zdrojů kliniky a nedostatkem personálu. V uplynulém roce se objevilo mnoho společností, které nabízejí řešení těchto problémů s Data Science. Využívání dat se stalo velkým průlomem pro soukromé kliniky, protože zlevňuje lékařské služby. Na pozadí pandemie také vzrostla poptávka po telemedicínských službách, v nichž jsou široce používány algoritmy strojového učení. Služby telemedicíny jsou žádány o předběžnou diagnostiku, práci s analýzami a vytváření chatovacích robotů.
Z hlediska technologických omezeníaplikace počítačového vidění a strojového učení nemá prakticky žádné překážky. Hlubší implementace algoritmů a služeb závisí na přání klinik a lékařů aplikovat metody Data Science. Je také akutní nedostatek školicích dat, a to je problém nejen pro komerční zdravotnická zařízení, ale také pro stát: vlády by měly demokratizovat přístup k datům veřejných nemocnic, aby vývojové společnosti mohly vytvářet moderní produkty.
Naučit se co i jen jeden program vyžaduje hodněúdaje o kvalitě. Abychom se naučili, jak rozlišit nádor v rámci, potřebuje program tisíce ručně analyzovaných obrazů pacientů a do analýzy by měli být zapojeni zkušení lékaři.
Lékař musí nejdříve najít nádor a pakukaž, kde je. Jak si dokážete představit, zkušení lékaři mají co dělat. Ale pandemie, kupodivu, pomohla některým oblastem. Například DiagnoCat, ruský startup, který využívá počítačové vidění k analýze obrazů ve stomatologii, dokázal přilákat neobsazené lékaře k analýze obrazů během uzamčení. Pokud jde o nechuť klinik a lékařů, lékaři prostě nedůvěřují těmto technologiím. Dobrý lékař jistě najde takový případ, když program stanoví špatnou diagnózu, nezkušený lékař se obává, že program udělá všechno lépe než on. Výsledkem je, že se vždy můžete ospravedlnit péčí o pacienta a právními aspekty.
Synergie datové vědy a lékařských technologiíjiž nám umožnil učinit skok vpřed ve vývoji řešení pro diagnostiku rakoviny, autoimunitních a neurodegenerativních onemocnění. Služby založené na analýze dat a strojovém učení jsou schopny předpovídat šíření virů a hledat nové generace drog. Navzdory skutečnosti, že klasické lékařské vzdělávání zaostává za výzvami, kterým dnes průmysl čelí, je reálné stát se moderním specialistou, který pracuje na rozhraní dvou vědeckých oborů - Data Science a Medicine. A jedním ze způsobů je online kurz na Fakultě datových věd v medicíně v GeekBrains.
Viz také:
Mlhoviny, komety a hvězdné školky: ukazující nejlepší astrofotografii roku
Data ze špionážních satelitů pomohla zjistit příčinu tání ledovců v Asii
Koronavirus v jeskyni: vše o čínských hornících, kteří v roce 2012 trpěli podivným zápalem plic