Adattudomány az orvostudományban: ki, hogyan és miért dolgozza fel az adatokat

Annak ellenére, hogy módszertani szempontból az informatika és az orvostudomány meglehetősen messze van egymástól.Barátom, ez az

A biológia és az orvosi kutatás ösztönözte az adatelemzést és a különböző analitikai modellek alkalmazását.Ma, még az orvosi intézményekben is, az orvosi statisztikai tanfolyamokon tanulmányozzák az adattudomány alapjait.És bár ezeket a módszereket az orvosi egyetemeken másképp nevezik, az orvosok számára meglehetősen nehéz alkalmazni őket a programozási tapasztalatok hiánya miatt.A programozási képesség az első dolog, ami ezen a területen szakembernek szükséges.Meg kell érteni a modern adatelemzési algoritmusokat - neurális hálózatokat.És nem csak ahhoz, hogy elméletileg megértsük, hogyan működik az algoritmus, hanem ehhez jól kell ismernie a magasabb matematikát, és képesnek kell lennie arra, hogy ezeket az algoritmusokat valós orvosi adatokon használja.Ehhez viszont speciális adattudományi eszközök, például Python-kódtárak és adat-előfeldolgozási módszerek ismeretére van szükség.

Hogyan vált a koronavírus az orvostudomány tudományának katalizátorává

Ma két fő irányvonal vanAdattudomány alkalmazott alkalmazása az orvostudományban - egészségügyben és gyógyszerészetben. Az első irány a diagnosztikai feladatokat, a klinikák és az orvosok munkájának optimalizálását, a gyógyszerek és kezelések diagnózis alapján történő kiválasztását tartalmazza. Az egyes globális problémákra használt megoldások adatelemzésen és gépi tanulási algoritmusokon alapulnak. A felhalmozott orvosi adatokat aktívan használják a gyógyszerfejlesztésben. Mind a hatóanyagok felkutatásában való felhasználásról, mind a gyógyszerek állatokon és embereken történő teszteléséről beszélünk.

Különleges szerepet játszik az adattudományi technológiák fejlesztésébenamelyet a koronavírus-járvány játszott. A koronavírus jövőbeli terjedésével kapcsolatban pontosabb adatokat szolgáltató prediktív modellek iránti igény jelentősen megnőtt: a kórházi ápolás számának, egyes korlátozó intézkedéseknek és oltásoknak a COVID-19-re gyakorolt ​​hatásának előrejelzése. És ha a klasszikus epidemiológiában az ilyen előrejelzések viszonylag egyszerű epidemiológiai modelleken alapulnak, akkor a valóságban ezek a modellek rendkívül gyengén mutatják magukat, míg a modern Data Science módszerek képesek ezeket helyettesíteni és javítani az előrejelzések pontosságán.

Az adattudomány fő alkalmazási területeiorvostudomány a pandémiában változatlan maradt, de az adatok mennyisége és a probléma megoldásának várható ideje jelentősen megváltozott. Például egy betegség diagnosztizálását a tüdő CT-jével hosszú ideje tanulmányozzák, a piacon elegendő számú működő megoldás létezik. De a világjárvány globális jellegének, az állandó adatcserének és elérhetőségüknek köszönhetően a COVID-19 CT által történő automatikus diagnosztizálásának feladatát a lehető leghamarabb megoldották. Ugyanez vonatkozik a betegség kimenetelének súlyosságának előrejelzésére, amely segíthet megjósolni a rendelkezésre álló kórházi ágyak számát. A probléma megoldása érdekében hatalmas mennyiségű adatot gyűjtenek és elemeznek párhuzamosan több országban. De az orvostudomány sajátossága olyan, hogy az új megoldások bevezetése gyakorlatilag lehetetlen. Csakúgy, mint az oltások esetében, minden modell gondos tesztelésére van szükség, mielőtt az orvosi döntések ettől függnének.

Milyen alapismeretek szükségesek az adattudományban való munkavégzéshez:

  • Felsõbb matematika: lineáris algebra, matematikai elemzés, statisztika.
  • Hogyan működnek a gépi tanulási módszerek.

Hogyan segíti az adattudomány a rák, az Alzheimer-kór és az új gyógyszerek elleni küzdelmet

Nézzük meg a különböző alkalmazási területeketAdattudomány az orvostudományban. Az egyik legígéretesebb a rák diagnózisa. Napjainkban az adatkutatók algoritmusok egész sorát használnak megoldások kidolgozására ezen a területen: a konkrét módszer kiválasztása az adott feladattól, a rendelkezésre álló adatoktól és mennyiségétől függ. Például diagnosztikát végezhet daganatképek segítségével – ebben az esetben a Data Science szakemberei nagy valószínűséggel neurális hálózatokat fognak használni. A diagnosztikához az elemzési eredmények alapján az adott feladathoz jobban illeszkedő gépi tanulási módszer kerül kiválasztásra. Különleges algoritmusokat is használnak, például az egyes sejtekből nyert DNS-adatok elemzésére. Az ilyen adatokat leggyakrabban gráfalgoritmusokkal elemzik. De ez inkább kivétel a szabály alól.

Ezenkívül számos módszert alkalmaznaka képek javítása és az eredmény pontosságának javítása érdekében. A nagy adatplatformok (például a Hadoop) például a MapReduce segítségével olyan paramétereket találnak, amelyek különféle feladatokhoz használhatók. Azok számára, akik saját terméküket szeretnék kifejleszteni ezen a területen, vagy egyszerűen csak rajongóknak, számos nyitott agyi képalkotó adatkészlet áll rendelkezésre: BrainWeb, IXI Dataset, fastMRI és OASIS.

Egy másik eset a szervmodellezésemberi, az egyik legnehezebb technikai feladat. Sőt, ennek vagy annak a megoldásnak a kidolgozása során a szakembernek pontosan meg kell értenie, miért és milyen összetettségi szinten modellezik a szervet. Például elkészíthet egy adott daganat modelljét a génexpresszió és a jelátviteli utak szintjén. Ma az Insilico Medicine cég megoldja ezeket a problémákat. Ezt a megközelítést használják a terápia céljának megtalálásához, többek között Data Science módszerekkel. Az ilyen modelleket főleg tudományos kutatásra használják, még mindig messze vannak a gyakorlati alkalmazástól.

A génszekvencia elemzése - egészaz orvostudomány iránya, amelynek fejlesztése egyszerűen lehetetlen az Adattudomány nélkül. Ha a Python programozási képességei rendkívül fontosak az adattudományban, akkor a génekkel való munkavégzéshez az R programozási nyelv és a specifikus bioinformatikai eszközök - a DNS és fehérje szekvenciákkal való együttműködés programjai - ismeretére is szükség van. Ezen programok többsége a Unix operációs rendszeren fut, és nem túl felhasználóbarát. Ahhoz, hogy elsajátítsd őket, meg kell értened legalább a molekuláris biológia és a genetika alapjait. Sajnos még az orvosi iskolákban is nagy gondok vannak ezzel, és a legtöbb orvosnak rosszul van elképzelése a génszekvenciák működéséről. Oroszországban két vállalat foglalkozik ezen a területen - az Atlas és a Genotech. Jelenleg az egyes gének mutációinak elemzése is népszerű. A legtöbb nagy orvosi elemző cég nyújt ilyen szolgáltatásokat. A betegek például megtudhatják, hogy hajlamosak-e az emlőrákra ugyanazokban a génekben, mint Angelina Jolie. Ezt a területet a munkaerőhiány jellemzi, mivel csak néhány helyen lehet megfelelő oktatást szerezni. Ezen kívül sokan vagy a természettudományban dolgoznak, vagy külföldre mennek. Kevés olyan orosz nyelvű online forrás található, ahol megtanulhat ilyen elemzést. Általában orvosokra vagy biológusokra irányulnak, és csak programozást és alapvető adatkezelést tanítanak. Annak érdekében, hogy gyakorlatorientáltabb oktatást kapjon, hozzáférve ehhez a területhez, elvégezhet egy tanfolyamot a GeekBrains Orvostudományi Karán.

Ma több is van a piaconeszközök az adatelemzéshez ezen a területen: MapReduce, SQL, Galaxy, Bioconductor. A MapReduce feldolgozza a genetikai adatokat, és csökkenti a genetikai szekvenciák feldolgozásához szükséges időt.

Az SQL a mi relációs adatbázis-nyelveaz adatok genomikus adatbázisokból történő lekérdezésére és visszakeresésére szolgálnak. A Galaxy egy nyílt forráskódú GUI alapú orvosbiológiai kutatási alkalmazás. Ez lehetővé teszi, hogy különböző műveleteket hajtson végre genomokkal.

Végül a Bioconductor egy nyílt forráskódú szoftver, amelyet genomi adatok elemzésére terveztek.

Fontos kereskedelmi és egybenkutatási irány - új generációs gyógyszerek létrehozása. A gyógyszerészek gépi tanulást használnak terápiás célpontok és biomarkerek keresésére. Természetesen sem az első, sem a második nem maguk a gyógyszerek. A célpontok olyan molekulák a szervezetben, amelyekkel a gyógyszer kölcsönhatásba lép, a biomarkerek pedig olyan molekulák, amelyek megmondják az orvosnak, hogy ki használja a gyógyszert. Ezért szinte minden olyan cég, amely ismeretlen célpontú és biomarkerekkel rendelkező betegségekre fejleszt gyógyszereket – a Novartis, a Merck, a Roche és az orosz BIOCAD – gépi tanulást alkalmaz. Ezek mindenekelőtt a rák és az autoimmun betegségek, az Alzheimer-kór. Ez magában foglalja az új antibiotikumok keresését is.

Miért nem támogatják az orvosok az adattudomány megvalósítását?

Az elmúlt évek azt mutatták, hogy a Data Sciencea prediktív és analitikai modellek iparának motorja az orvostudományban, például az ideghálózatok alkalmazásában a fehérjék térszerkezetének meghatározására. A világjárvány azonban számos országban globális problémát tárt fel a klinikai erőforrások optimalizálásával és a személyzet hiányával kapcsolatban. Az elmúlt egy évben számos vállalat jelentett megoldást ezekre a problémákra a Data Science segítségével. Az adatok felhasználása nagy áttöréssé vált a magánklinikák számára, mivel olcsóbbá teszi az orvosi szolgáltatásokat. A világjárvány hátterében megnőtt a kereslet a távorvoslás iránt is, amelyben széles körben használják a gépi tanulási algoritmusokat. A távorvoslás szolgáltatásainak igénye van az előzetes diagnózisra, elemzésekkel és csevegőrobotok létrehozásával.

Ami a technológiai korlátokat illetia számítógépes látás és a gépi tanulás alkalmazásának gyakorlatilag nincsenek akadályai. Az algoritmusok és szolgáltatások mélyebb megvalósítása attól függ, hogy a klinikák és az orvosok kívánják-e az adattudományi módszereket alkalmazni. A képzési adatokból is akut hiány van, és ez nemcsak a kereskedelmi egészségügyi intézményeket, hanem az államot is érinti: a kormányoknak demokratizálniuk kellene az állami kórházi adatokhoz való hozzáférést, hogy a fejlesztő cégek korszerű termékeket alkossanak.

Még egy program megtanulása is sokat igényelminőségi adatok. Annak érdekében, hogy megtanulják, hogyan lehet megkülönböztetni a daganatot egy keretben, a programnak több ezer, kézzel elemzett képre van szüksége a betegekről, és tapasztalt orvosokat kell bevonni az elemzésbe.

Az orvosnak először meg kell találnia a daganatot, majdmutasd meg hol van. Ahogy el lehet képzelni, a tapasztalt orvosoknak még sok más dolguk van. De a pandémia furcsa módon segített egyes területeken. Például a DiagnoCat, egy orosz startup, amely számítógépes látásmóddal elemzi a képeket a fogászatban, képes volt arra, hogy nem foglalkoztatott orvosokat vonzzon a képek elemzésére egy lezárás során. Ami a klinikák és az orvosok vonakodását illeti, az orvosok egyszerűen nem bíznak az ilyen technológiákban. Egy jó orvos biztosan talál egy ilyen esetet, amikor a program helytelen diagnózist állít fel, egy tapasztalatlan orvos attól tart, hogy a program mindent jobban csinál, mint ő. Ennek eredményeként mindig igazolhatja magát a beteg és a jogi szempontok figyelembevételével.

Az adattudomány és az orvostechnológia szinergiájalehetővé tette számunkra, hogy előrelépést tegyünk a rák, az autoimmun és a neurodegeneratív betegségek diagnosztizálására szolgáló megoldások kidolgozásában. Az adatok elemzésével és a gépi tanulással működő szolgáltatások képesek megjósolni a vírusok terjedését, és új gyógyszerek generációit keresni. Annak ellenére, hogy a klasszikus orvosképzés elmarad az ipar előtt álló kihívások mögött, valós, ha modern szakembergé válunk, aki két tudományos terület - az adattudomány és az orvoslás - találkozásánál dolgozik. És az egyik út az online tanfolyam a GeekBrains Orvostudományi Karán.

Lásd még:

Ködök, üstökösök és csillagfaiskolák: az év legjobb asztrofotográfiáját mutatják be

Kém műholdak adatai segítettek kideríteni az ázsiai gleccserek olvadásának okát

Koronavírus egy barlangban: mindazok a kínai bányászok, akik furcsa tüdőgyulladásban szenvedtek 2012-ben