Наука података у медицини: ко, како и зашто обрађује податке

Упркос чињеници да су са методолошке тачке гледишта ИТ и медицина прилично удаљене једна од друге, јесте

биологија и медицинска истраживања су довелаанализирање података и примена различитих аналитичких модела напред. Данас, чак иу медицинским институтима, на курсевима медицинске статистике, изучавају се основе науке о подацима. И иако се ове методе на медицинским универзитетима називају другачије, лекарима је прилично тешко да их користе - због недостатка искуства у програмирању. Способност програмирања је прва ствар која се тражи од специјалисте у овој области. Неопходно је разумети савремене алгоритме анализе података – неуронске мреже. Штавише, не ради се само о теоријском разумевању како алгоритам функционише; за ово морате добро владати вишом математиком и бити у могућности да користите ове алгоритме на стварним медицинским подацима. Ово, заузврат, захтева од стручњака да поседује познавање специјалних алата Дата Сциенце – Питхон библиотека и метода за претходну обраду података.

Како је коронавирус постао катализатор за науку о подацима у медицини

Данас постоје два кључна правцапримењена примена Дата Сциенце у медицини – здравству и фармацији. Први правац обухвата дијагностичке задатке, оптимизацију рада клиника и лекара, избор лекова и третмана на основу дијагнозе. Решења која се користе у сваком од ових глобалних проблема заснована су на анализи података и алгоритмима машинског учења. Акумулирани медицински подаци се активно користе у развоју лекова. Реч је како о употреби у потрази за активним супстанцама, тако и о испитивању лекова на животињама и људима.

Посебна улога у развоју технологија Дата Сциенцекоју је одиграла пандемија коронавируса. Потреба за предиктивним моделима који би могли да пруже тачније податке о будућем ширењу коронавируса нагло се повећала: да би се предвидео број хоспитализација, утицај одређених рестриктивних мера и вакцинација на ЦОВИД-19. И ако су у класичној епидемиологији таква предвиђања заснована на релативно једноставним епидемиолошким моделима, у стварности су се ови модели показали изузетно лоше, док су савремене методе науке о подацима у стању да их замене и побољшају тачност предвиђања.

Главна подручја примене науке о подацима улек током пандемије остао је исти, али количина података и очекивано време за решавање проблема су се значајно променили. На пример, задатак дијагностиковања болести ЦТ-ом плућа већ је дуго проучаван; на тржишту постоји довољан број радних решења. Али захваљујући глобалној природи пандемије, сталној размени података и њиховој доступности, задатак аутоматске дијагнозе ЦОВИД-19 помоћу ЦТ решен је што је пре могуће. Исто се односи и на предвиђање тежине исхода болести, што би могло помоћи у предвиђању броја расположивих болничких кревета. Да би се решио овај проблем, паралелно се прикупља и анализира огромна количина података у неколико земаља. Али специфичност медицине је таква да је увођење нових решења практично немогуће. Као и код вакцина, потребно је пажљиво тестирање било ког модела пре него што медицинске одлуке зависе од њега.

Која основна знања су потребна за рад у науци података:

  • Виша математика: линеарна алгебра, математичка анализа, статистика.
  • Како функционишу методе машинског учења.

Како наука о подацима помаже у борби против рака, Алзхеимерове болести и нових лекова

Хајде да погледамо различите области применеНаука о подацима у медицини. Једна од најперспективнијих је дијагноза рака. Данас, научници података користе читав низ алгоритама за развој решења у овој области: избор специфичне методе зависи од задатка који се налази, података који су доступни и њиховог обима. На пример, можете направити дијагностику помоћу слика тумора - у овом случају ће стручњаци Дата Сциенце највероватније користити неуронске мреже. За дијагностику, на основу резултата анализе, биће изабрана једна од метода машинског учења која је погоднија за одређени задатак. Постоје и специфични алгоритми који се користе, на пример, за анализу ДНК података добијених из појединачних ћелија. Такви подаци се најчешће анализирају коришћењем алгоритама графикона. Али ово је пре изузетак од правила.

Поред тога, примењује се неколико методада бисте побољшали слике и побољшали тачност резултата. Платформе за велике податке (као што је Хадооп) користе, на пример, МапРедуце за проналажење параметара који се могу користити у различитим задацима. За оне који ће развити сопствени производ у овој области или само за ентузијасте, постоји неколико отворених скупова података о сликању мозга: БраинВеб, ИКСИ Датасет, фастМРИ и ОАСИС.

Други случај је моделирање органачовек, један од најтежих техничких задатака. Штавише, када развија ово или оно решење, специјалиста мора тачно да разуме зашто и на ком нивоу сложености се орган моделира. На пример, можете направити модел одређеног тумора на нивоу експресије гена и сигналних путева. Данас компанија Инсилицо Медицине решава такве проблеме. Овај приступ се користи за проналажење циља терапије, укључујући и методе Дата Сциенце. Такви модели се углавном користе за научна истраживања, али су још увек далеко од практичне примене.

Анализа секвенце гена - целаправац медицине чији је развој једноставно немогућ без Дата Сциенце-а. Ако су вештине програмирања Питхон изузетно важне у науци података, онда је за рад са генима потребно и знање Р програмског језика и специфичних алата за биоинформатику - програма за рад са ДНК и протеинским секвенцама. Већина ових програма ради на оперативном систему Уник и нису врло једноставни за употребу. Да бисте их савладали, морате бар да разумете основе молекуларне биологије и генетике. Нажалост, чак и данас на медицинским факултетима постоје велики проблеми с тим, а већина лекара заправо има лошу представу о томе како раде секвенце гена. У Русији су две компаније ангажоване у овој области - Атлас и Генотецх. Анализа мутација појединачних гена такође је популарна у данашње време. Већина великих компанија за медицинску анализу пружа такве услуге. Пацијенти, на пример, могу да сазнају да ли имају предиспозицију за рак дојке у истим генима као Ангелина Јолие. Ово подручје карактерише недостатак особља, јер постоји само неколико места на којима можете стећи одговарајуће образовање. Поред тога, многи или остају да раде у науци или одлазе у иностранство. Мало је интернет извора на руском језику, на којима можете научити такву анализу. Обично су усмерени на лекаре или биологе и предају само програмирање и основне манипулације подацима. Да бисте стекли образовање оријентисано ка пракси са приступом овој области, можете да завршите курс на Медицинском факултету података у ГеекБраинс-у.

Данас их има неколико на тржиштуалати за анализу података у овој области: МапРедуце, ​​СКЛ, Галаки, Биоцондуцтор. МапРедуце обрађује генетске податке и смањује време потребно за обраду генетских секвенци.

СКЛ је релациони језик базе података који микористе се за постављање упита и преузимање података из геномских база података. Галаки је апликација за биомедицинско истраживање заснована на ГУИ-у отвореног кода. Омогућава вам извођење различитих операција са геномима.

Коначно, Биоцондуцтор је софтвер отвореног кода дизајниран за анализу геномских података.

Важна реклама и истовременосмер истраживања - стварање лекова нове генерације. Фармацеутски стручњаци користе машинско учење за тражење терапеутских циљева и биомаркера. Ни прво ни друго, наравно, нису сами лекови. Мете су молекули у телу са којима је лек у интеракцији, а биомаркери су молекули који говоре лекару ко треба да користи лек. Због тога скоро све компаније које развијају лекове за болести са непознатим циљевима и биомаркерима – Новартис, Мерцк, Роцхе и руски БИОЦАД – користе машинско учење. То су, пре свега, рак и аутоимуне болести, Алцхајмерова болест. Ово такође укључује потрагу за новим антибиотицима.

Зашто лекари не подстичу примену науке о подацима

Последње године показале су да Дата Сциенцеје мотор индустрије предиктивних и аналитичких модела у медицини, на пример, у примени неуронских мрежа за одређивање просторне структуре протеина. Али пандемија је у многим земљама открила глобални проблем повезан са оптимизацијом клиничких ресурса и недостатком особља. Током протекле године појавиле су се многе компаније које нуде решења за ове проблеме са Дата Сциенце-ом. Употреба података постала је велики напредак за приватне клинике, јер медицинске услуге чини јефтинијим. У позадини пандемије, повећана је и потражња за телемедицинским услугама, у којима се широко користе алгоритми машинског учења. Услуге телемедицине су потребне за прелиминарну дијагнозу, радећи са анализама и креирајући цхат ботове.

У погледу технолошких ограничењапримена компјутерског вида и машинског учења практично нема препрека. Дубља имплементација алгоритама и услуга зависи од жеље клиника и лекара да примене методе науке о подацима. Такође постоји акутни недостатак података о обуци, а то је питање не само за комерцијалне здравствене установе, већ и за државу: владе би требало да демократизују приступ подацима из јавних болница како би развојне компаније могле да креирају модерне производе.

Учење чак и једног програма захтева многоподаци о квалитету. Да би научио како да разликује тумор у оквиру, програм захтева хиљаде ручно анализираних слика пацијената, а у анализу би требало да буду укључени искусни лекари.

Лекар прво мора да пронађе тумор, а затимпокажи где је. Као што можете да замислите, искусни лекари морају да ураде још много тога. Али пандемија је, чудно, помогла неким областима. На пример, ДиагноЦат, руски стартуп који користи рачунарски вид за анализу слика у стоматологији, успео је да привуче незапослене докторе да анализирају слике током закључавања. Што се тиче нерада клиника и лекара, лекари једноставно немају поверења у такве технологије. Добар лекар ће сигурно пронаћи такав случај када програм постави погрешну дијагнозу, неискусни лекар се плаши да ће програм учинити све боље од њега. Као резултат, увек се можете оправдати бригом о пацијенту и правним аспектима.

Синергија науке о подацима и медицинских технологијаје већ омогућио искорак у развоју решења за дијагнозу карцинома, аутоимуних и неуродегенеративних болести. Услуге засноване на анализи података и машинском учењу могу предвидети ширење вируса и потражити нове генерације лекова. Упркос чињеници да класично медицинско образовање заостаје за изазовима са којима се индустрија данас суочава, стварно је постати савремени специјалиста који ради на споју две научне области - науке о подацима и медицине. И један од начина је онлајн курс на Медицинском факултету ГеекБраинс-а.

Погледајте и:

Маглине, комете и звездани расадници: приказују најбољу астрофотографију године

Подаци шпијунских сателита помогли су да се открије узрок топљења глечера у Азији

Коронавирус у пећини: све о кинеским рударима који су 2012. патили од чудне упале плућа