Въпреки факта, че от методологична гледна точка ИТ и медицината са доста далеч един от друг.Приятелю, така е
Как коронавирусът стана катализатор за науката за данните в медицината
Днес има две ключови направленияприложно приложение на Data Science в медицината – здравеопазване и фармацевтика. Първото направление включва диагностични задачи, оптимизиране на работата на клиниките и лекарите, избор на лекарства и лечения въз основа на диагнозата. Решенията, които се използват при всеки от тези глобални проблеми, се основават на анализ на данни и алгоритми за машинно обучение. Натрупаните медицински данни се използват активно при разработването на лекарства. Говорим както за използване при търсене на активни вещества, така и за тестване на лекарства върху животни и хора.
Специална роля в развитието на Data Science технологиитеизиграна от пандемията на коронавируса. Необходимостта от прогнозни модели, които биха могли да предоставят по-точни данни за бъдещото разпространение на коронавирус, рязко се е увеличила: за да се предскаже броят на хоспитализациите, въздействието на някои ограничителни мерки и ваксинации върху COVID-19. И ако в класическата епидемиология подобни прогнози се основават на относително прости епидемиологични модели, то в действителност тези модели са се показали изключително зле, докато съвременните методи на Data Science са в състояние да ги заменят и да подобрят точността на прогнозите.
Основните области на приложение на науката за данни влекарството по време на пандемията остава същото, но количеството данни и очакваното време за решаване на проблема са се променили значително. Например, задачата за диагностициране на заболяване чрез КТ на белите дробове е проучена дълго време; на пазара има достатъчен брой работещи решения. Но благодарение на глобалния характер на пандемията, постоянния обмен на данни и тяхната наличност, задачата за автоматична диагностика на COVID-19 чрез CT беше решена възможно най-скоро. Същото се отнася и за прогнозиране на тежестта на изхода на заболяването, което може да помогне за прогнозиране на броя на наличните болнични легла. За да се реши този проблем, се събират и анализират паралелно огромно количество данни в няколко държави. Но спецификата на медицината е такава, че въвеждането на нови решения е практически невъзможно. Както при ваксините, е необходимо внимателно тестване на всеки модел, преди медицинските решения да зависят от него.
Какви основни знания са необходими за работа в Data Science:
- Висша математика: линейна алгебра, математически анализ, статистика.
- Как работят методите за машинно обучение.
Как науката за данните помага в борбата с рака, болестта на Алцхаймер и новите лекарства
Нека да разгледаме различни области на приложениеНаука за данните в медицината. Една от най-обещаващите е диагностицирането на рак. Днес специалистите по данни използват цял набор от алгоритми за разработване на решения в тази област: изборът на конкретен метод зависи от поставената задача, наличните данни и техния обем. Например, можете да направите диагностика с помощта на изображения на тумори - в този случай специалистите по Data Science най-вероятно ще използват невронни мрежи. За диагностика, въз основа на резултатите от анализа, ще бъде избран един от методите за машинно обучение, който е по-подходящ за конкретна задача. Има и специфични алгоритми, използвани например за анализиране на ДНК данни, получени от единични клетки. Такива данни най-често се анализират с помощта на графични алгоритми. Но това е по-скоро изключение от правилото.
Освен това се прилагат няколко методаза подобряване на изображенията и подобряване на точността на резултата. Платформите за големи данни (като Hadoop) използват например MapReduce, за да намерят параметри, които могат да се използват в различни задачи. За тези, които ще разработят свой собствен продукт в тази област, или просто ентусиасти, има няколко отворени набора от данни за изображения на мозъка: BrainWeb, IXI Dataset, fastMRI и OASIS.
Друг случай е моделирането на органичовек, една от най-трудните технически задачи. Освен това, когато разработва това или онова решение, специалистът трябва да разбере точно защо и на какво ниво на сложност се моделира органът. Например можете да направите модел на специфичен тумор на ниво генна експресия и сигнални пътища. Днес компанията Insilico Medicine решава подобни проблеми. Този подход се използва за намиране на целта на терапията, включително чрез методите Data Science. Такива модели се използват главно за научни изследвания; те все още са далеч от практическото приложение.
Анализ на генната последователност - цялпосока на медицината, чието развитие е просто невъзможно без Data Science. Ако уменията за програмиране на Python са изключително важни в Data Science, тогава работата с гени изисква също познаване на езика за програмиране R и специфични инструменти за биоинформатика - програми за работа с ДНК и протеинови последователности. Повечето от тези програми работят на операционната система Unix и не са много лесни за ползване. За да ги овладеете, трябва поне да разберете основите на молекулярната биология и генетиката. За съжаление, дори в медицинските училища днес има големи проблеми с това и всъщност повечето лекари имат лоша представа за това как работят генните последователности. В Русия две компании са ангажирани в тази област - Atlas и Genotech. Анализът за мутации на отделни гени също е популярен в момента. Повечето големи компании за медицински анализ предоставят такива услуги. Пациентите например могат да разберат дали имат предразположение към рак на гърдата при същите гени като Анджелина Джоли. Тази област се характеризира с недостиг на персонал, тъй като има само няколко места, където можете да получите подходящо образование. Освен това мнозина остават да работят в науката или отиват в чужбина. Малко са рускоезичните онлайн ресурси, където можете да научите подобен анализ. Те обикновено са насочени към лекари или биолози и преподават само програмиране и манипулиране на основни данни. За да получите по-ориентирано към практиката образование с достъп до тази област, можете да завършите курс във Факултета по наука за данни в медицината в GeekBrains.
Има няколко на пазара днесинструменти за анализ на данни в тази област: MapReduce, SQL, Galaxy, Bioconductor. MapReduce обработва генетични данни и намалява времето, необходимо за обработка на генетични последователности.
SQL е релационният език на базата данни, който ниесе използват за заявки и извличане на данни от геномни бази данни. Galaxy е приложение за биомедицински изследвания, базирано на GUI с отворен код. Тя ви позволява да извършвате различни операции с геноми.
И накрая, Bioconductor е софтуер с отворен код, предназначен за анализ на геномни данни.
Важно търговско и същевременноизследователска посока - създаване на лекарства от ново поколение. Фармацевтичните специалисти използват машинно обучение за търсене на терапевтични цели и биомаркери. Нито първото, нито второто, разбира се, са самите лекарства. Мишените са молекули в тялото, с които лекарството взаимодейства, а биомаркерите са молекули, които казват на лекаря кой трябва да използва лекарството. Затова почти всички компании, които разработват лекарства за заболявания с неизвестни мишени и биомаркери – Novartis, Merck, Roche и руската BIOCAD – използват машинно обучение. Това са на първо място рак и автоимунни заболявания, болестта на Алцхаймер. Това включва и търсенето на нови антибиотици.
Защо лекарите не насърчават прилагането на науката за данни
Последните години показаха, че Data Scienceе двигателят на индустрията на прогнозни и аналитични модели в медицината, например при прилагането на невронни мрежи за определяне на пространствената структура на протеините. Но пандемията разкри глобален проблем в много страни, свързан с оптимизирането на ресурсите на клиниката и липсата на персонал. През последната година много компании се появиха, предлагайки решения на тези проблеми с Data Science. Използването на данни се превърна в голям пробив за частните клиники, тъй като прави медицинските услуги по -евтини. На фона на пандемията, търсенето на телемедицински услуги също се е увеличило, при което алгоритмите за машинно обучение са широко използвани. Телемедицинските услуги са търсени за предварителна диагноза, работа с анализи и създаване на чат ботове.
По отношение на технологичните ограниченияприлагането на компютърно зрение и машинно обучение практически няма бариери. По-дълбокото внедряване на алгоритми и услуги зависи от желанието на клиниките и лекарите да прилагат методите на Data Science. Съществува и остър недостиг на данни за обучение и това е проблем не само за търговските здравни институции, но и за държавата: правителствата трябва да демократизират достъпа до данните на публичните болници, така че компаниите за развитие да могат да създават модерни продукти.
Изучаването дори на една програма изисква многокачествени данни. За да се научи как да различава тумор в рамка, програмата се нуждае от хиляди ръчно анализирани изображения на пациенти и опитни лекари трябва да бъдат включени в анализа.
Лекарят първо трябва да открие тумора, а след товапокажете къде е. Както можете да си представите, опитните лекари имат много други неща за вършене. Но пандемията, колкото и да е странно, помогна на някои области. Например DiagnoCat, руска стартираща компания, която използва компютърно зрение за анализ на изображения в стоматологията, успя да привлече незаети лекари да анализират изображения по време на блокиране. Що се отнася до нежеланието на клиники и лекари, лекарите просто не се доверяват на такива технологии. Добрият лекар със сигурност ще намери такъв случай, когато програмата постави грешна диагноза, неопитен лекар се страхува, че програмата ще направи всичко по -добре от него. В резултат на това винаги можете да се оправдаете, като се погрижите за пациента и правните аспекти.
Синергия на науката за данните и медицинските технологиивече позволи скок напред в разработването на решения за диагностика на рак, автоимунни и невродегенеративни заболявания. Услугите, базирани на анализ на данни и машинно обучение, са в състояние да предскажат разпространението на вируси и да търсят нови поколения лекарства. Въпреки факта, че класическото медицинско образование изостава от предизвикателствата, пред които е изправена индустрията днес, реално е да се превърнете в модерен специалист, работещ на кръстопътя на две научни области - Data Science и Medicine. И един от начините е онлайн курсът във Факултета по наука за данни в медицината в GeekBrains.
Вижте също:
Мъглявини, комети и звездни разсадници: показва най-добрата астрофотография на годината
Данните от шпионски спътници помогнаха да се установи причината за топенето на ледниците в Азия
Коронавирус в пещера: всичко за китайските миньори, страдащи от странна пневмония през 2012 г.