Obwohl IT und Medizin aus methodischer Sicht recht weit voneinander entfernt sind, ist dies der Fall
Wie das Coronavirus zu einem Katalysator für die Datenwissenschaft in der Medizin wurde
Heute gibt es zwei SchlüsselrichtungenAngewandte Anwendung von Data Science in der Medizin – Gesundheitswesen und Pharmazie. Die erste Richtung umfasst diagnostische Aufgaben, die Optimierung der Arbeit von Kliniken und Ärzten, die Auswahl von Medikamenten und Behandlungen auf der Grundlage der Diagnose. Die Lösungen, die für jedes dieser globalen Probleme verwendet werden, basieren auf Datenanalyse und Algorithmen für maschinelles Lernen. Gesammelte medizinische Daten werden aktiv in der Arzneimittelentwicklung genutzt. Dabei geht es sowohl um den Einsatz bei der Suche nach Wirkstoffen als auch um die Erprobung von Medikamenten an Tieren und Menschen.
Eine besondere Rolle bei der Entwicklung von Data Science Technologienvon der Coronavirus-Pandemie gespielt. Der Bedarf an Vorhersagemodellen, die genauere Daten über die zukünftige Ausbreitung des Coronavirus liefern könnten, ist stark gestiegen: um die Zahl der Krankenhauseinweisungen, die Auswirkungen bestimmter restriktiver Maßnahmen und Impfungen auf COVID-19 vorherzusagen. Und wenn in der klassischen Epidemiologie solche Vorhersagen auf relativ einfachen epidemiologischen Modellen basieren, dann haben sich diese Modelle in der Realität extrem schlecht bewährt, während moderne Data Science-Methoden sie ersetzen und die Genauigkeit von Vorhersagen verbessern können.
Die Hauptanwendungsgebiete von Data Science inMedizin während der Pandemie gleich geblieben, aber die Datenmenge und die voraussichtliche Zeit zur Lösung des Problems haben sich deutlich verändert. So wird beispielsweise die Aufgabe, eine Krankheit mittels CT der Lunge zu diagnostizieren, seit langem untersucht, funktionierende Lösungen gibt es ausreichend auf dem Markt. Aber dank des globalen Charakters der Pandemie, des ständigen Austauschs von Daten und deren Verfügbarkeit wurde die Aufgabe der automatischen Diagnose von COVID-19 durch CT so schnell wie möglich gelöst. Dasselbe gilt für die Vorhersage des Schweregrads des Krankheitsausgangs, der dazu beitragen könnte, die Anzahl der verfügbaren Krankenhausbetten vorherzusagen. Um dieses Problem zu lösen, werden in mehreren Ländern parallel riesige Datenmengen gesammelt und analysiert. Aber die Spezifität der Medizin ist so groß, dass die Einführung neuer Lösungen praktisch unmöglich ist. Wie bei Impfstoffen sind sorgfältige Tests jedes Modells erforderlich, bevor medizinische Entscheidungen davon abhängen können.
Welche Grundkenntnisse sind erforderlich, um in Data Science zu arbeiten:
- Höhere Mathematik: Lineare Algebra, Mathematische Analysis, Statistik.
- So funktionieren maschinelle Lernmethoden.
Wie Data Science hilft, Krebs und Alzheimer zu bekämpfen und neue Medikamente zu finden
Schauen wir uns verschiedene Anwendungsbereiche anDatenwissenschaft in der Medizin. Eine der vielversprechendsten ist die Diagnose Krebs. Heutzutage nutzen Datenwissenschaftler eine ganze Reihe von Algorithmen, um Lösungen in diesem Bereich zu entwickeln: Die Wahl einer bestimmten Methode hängt von der Aufgabenstellung, den verfügbaren Daten und deren Umfang ab. Beispielsweise können Sie die Diagnose anhand von Tumorbildern stellen – in diesem Fall werden Data-Science-Spezialisten höchstwahrscheinlich neuronale Netze verwenden. Für die Diagnose wird anhand der Analyseergebnisse eine der maschinellen Lernmethoden ausgewählt, die für eine bestimmte Aufgabe besser geeignet ist. Es gibt auch spezielle Algorithmen, die beispielsweise zur Analyse von DNA-Daten einzelner Zellen eingesetzt werden. Solche Daten werden am häufigsten mithilfe von Diagrammalgorithmen analysiert. Dies ist jedoch eher eine Ausnahme von der Regel.
Darüber hinaus werden mehrere Methoden angewendetum Bilder zu verbessern und die Genauigkeit des Ergebnisses zu verbessern. Big-Data-Plattformen (wie Hadoop) verwenden beispielsweise MapReduce, um Parameter zu finden, die in verschiedenen Aufgaben verwendet werden können. Für diejenigen, die ein eigenes Produkt in diesem Bereich entwickeln, oder einfach nur Enthusiasten, gibt es mehrere Open-Hirn-Imaging-Datensätze: BrainWeb, IXI-Datensatz, fastMRI und OASIS.
Ein anderer Fall ist die OrganmodellierungMensch, eine der schwierigsten technischen Aufgaben. Darüber hinaus muss ein Spezialist bei der Entwicklung einer bestimmten Lösung genau verstehen, warum und in welcher Komplexität das Organ modelliert wird. Sie können beispielsweise ein Modell eines bestimmten Tumors auf der Ebene der Genexpression und der Signalwege erstellen. Heute löst die Firma Insilico Medicine solche Probleme. Dieser Ansatz wird verwendet, um das Therapieziel zu finden, auch mit Methoden der Data Science. Solche Modelle werden hauptsächlich für die wissenschaftliche Forschung verwendet, sie sind noch weit von einer praktischen Anwendung entfernt.
Gensequenzanalyse - Ganzeine Richtung der Medizin, deren Entwicklung ohne Data Science einfach unmöglich ist. Wenn Python-Programmierkenntnisse in Data Science extrem wichtig sind, dann erfordert die Arbeit mit Genen auch Kenntnisse der Programmiersprache R und spezifischer Bioinformatik-Tools – Programme für die Arbeit mit DNA- und Proteinsequenzen. Die meisten dieser Programme laufen auf dem Unix-Betriebssystem und sind nicht sehr benutzerfreundlich. Um sie zu beherrschen, müssen Sie zumindest die Grundlagen der Molekularbiologie und Genetik verstehen. Leider gibt es auch heute noch an medizinischen Fakultäten große Probleme damit, und die meisten Ärzte haben tatsächlich eine schlechte Vorstellung davon, wie die Gensequenzen funktionieren. In Russland sind zwei Unternehmen in diesem Bereich tätig - Atlas und Genotech. Auch die Analyse auf Mutationen einzelner Gene ist derzeit beliebt. Die meisten großen medizinischen Analyseunternehmen bieten solche Dienstleistungen an. So können Patientinnen beispielsweise herausfinden, ob sie in den gleichen Genen wie Angelina Jolie eine Veranlagung für Brustkrebs haben. Dieser Bereich ist durch Personalmangel gekennzeichnet, da es nur an wenigen Orten eine entsprechende Ausbildung gibt. Darüber hinaus bleiben viele entweder, um in der Wissenschaft zu arbeiten oder gehen ins Ausland. Es gibt nur wenige russischsprachige Online-Ressourcen, in denen Sie eine solche Analyse lernen können. Sie richten sich meist an Mediziner oder Biologen und lehren nur Programmierung und grundlegende Datenmanipulation. Um eine praxisorientiertere Ausbildung mit Zugang zu diesem Bereich zu erhalten, können Sie einen Kurs an der Fakultät für Data Science in der Medizin bei GeekBrains absolvieren.
Es gibt heute mehrere auf dem MarktTools zur Datenanalyse in diesem Bereich: MapReduce, SQL, Galaxy, Bioconductor. MapReduce verarbeitet genetische Daten und reduziert den Zeitaufwand für die Verarbeitung genetischer Sequenzen.
SQL ist die relationale Datenbanksprache, die wirwerden verwendet, um Daten aus genomischen Datenbanken abzufragen und abzurufen. Galaxy ist eine Open-Source-GUI-basierte biomedizinische Forschungsanwendung. Es ermöglicht Ihnen, verschiedene Operationen mit Genomen durchzuführen.
Schließlich ist Bioconductor eine Open-Source-Software, die für die Analyse von Genomdaten entwickelt wurde.
Wichtiger Werbespot und gleichzeitigForschungsrichtung - die Entwicklung von Medikamenten der neuen Generation. Pharmaspezialisten nutzen maschinelles Lernen, um nach therapeutischen Zielen und Biomarkern zu suchen. Weder das erste noch das zweite sind natürlich die Medikamente selbst. Ziele sind Moleküle im Körper, mit denen ein Medikament interagiert, und Biomarker sind Moleküle, die einem Arzt sagen, wer das Medikament einnehmen soll. Daher nutzen fast alle Unternehmen, die Medikamente gegen Krankheiten mit unbekannten Zielen und Biomarkern entwickeln – Novartis, Merck, Roche und das russische BIOCAD – maschinelles Lernen. Dies sind vor allem Krebs- und Autoimmunerkrankungen, die Alzheimer-Krankheit. Dazu gehört auch die Suche nach neuen Antibiotika.
Warum Ärzte die Implementierung von Data Science nicht fördern
Die letzten Jahre haben gezeigt, dass Data Scienceist der Motor der Industrie prädiktiver und analytischer Modelle in der Medizin, beispielsweise bei der Anwendung neuronaler Netze zur Bestimmung der räumlichen Struktur von Proteinen. Aber die Pandemie hat in vielen Ländern ein globales Problem im Zusammenhang mit der Optimierung der Klinikressourcen und dem Personalmangel aufgedeckt. Im letzten Jahr sind viele Unternehmen entstanden, die Lösungen für diese Probleme mit Data Science anbieten. Die Nutzung von Daten ist für Privatkliniken zu einem großen Durchbruch geworden, da sie medizinische Leistungen billiger macht. Vor dem Hintergrund der Pandemie ist auch die Nachfrage nach telemedizinischen Dienstleistungen gestiegen, bei denen maschinelle Lernalgorithmen weit verbreitet sind. Gefragt sind telemedizinische Dienste für eine Vorabdiagnose, die Arbeit mit Analysen und die Erstellung von Chatbots.
Im Hinblick auf technologische EinschränkungenDer Anwendung von Computer Vision und maschinellem Lernen stehen praktisch keine Grenzen entgegen. Eine tiefere Implementierung von Algorithmen und Diensten hängt vom Wunsch von Kliniken und Ärzten ab, Data-Science-Methoden anzuwenden. Zudem besteht ein akuter Mangel an Trainingsdaten, und das ist nicht nur ein Problem für kommerzielle Gesundheitseinrichtungen, sondern auch für den Staat: Regierungen sollten den Zugang zu öffentlichen Krankenhausdaten demokratisieren, damit Entwicklungsunternehmen moderne Produkte entwickeln können.
Schon das Erlernen eines Programms erfordert vielQualitätsdaten. Um zu lernen, wie man einen Tumor in einem Rahmen unterscheidet, benötigt das Programm Tausende von manuell analysierten Bildern von Patienten, an der Analyse sollten erfahrene Ärzte beteiligt sein.
Der Arzt muss zuerst den Tumor finden und dannzeigen wo sie ist. Wie Sie sich vorstellen können, haben erfahrene Ärzte viele andere Aufgaben. Aber die Pandemie hat seltsamerweise einigen Bereichen geholfen. Beispielsweise konnte DiagnoCat, ein russisches Startup, das Computer Vision verwendet, um Bilder in der Zahnmedizin zu analysieren, unbesetzte Ärzte dazu bringen, während eines Lockdowns Bilder zu analysieren. Was die Zurückhaltung von Kliniken und Ärzten angeht, trauen Ärzte solchen Technologien einfach nicht. Ein guter Arzt wird sicher einen solchen Fall finden, wenn das Programm eine falsche Diagnose stellt, ein unerfahrener Arzt befürchtet, dass das Programm alles besser macht als er. Dadurch können Sie sich jederzeit rechtfertigen, indem Sie sich um die Patienten- und Rechtsaspekte kümmern.
Synergie von Data Science und Medizintechnikhat uns bereits einen Sprung nach vorne in der Entwicklung von Lösungen für die Diagnose von Krebs, Autoimmun- und neurodegenerativen Erkrankungen ermöglicht. Dienste, die auf Datenanalyse und maschinellem Lernen basieren, können die Ausbreitung von Viren vorhersagen und nach neuen Generationen von Medikamenten suchen. Trotz der Tatsache, dass die klassische medizinische Ausbildung den Herausforderungen der heutigen Branche hinterherhinkt, ist es real, ein moderner Spezialist zu werden, der an der Schnittstelle zweier wissenschaftlicher Bereiche arbeitet - Data Science und Medizin. Und eine Möglichkeit ist der Online-Kurs an der Fakultät für Datenwissenschaft in der Medizin bei GeekBrains.
Siehe auch:
Nebel, Kometen und Sternenkindergärten: zeigen die beste Astrofotografie des Jahres
Daten von Spionagesatelliten halfen, die Ursache für das Schmelzen der Gletscher in Asien herauszufinden
Coronavirus in einer Höhle: Alles über chinesische Bergleute, die 2012 an einer seltsamen Lungenentzündung litten