Même si d'un point de vue méthodologique, l'informatique et la médecine sont assez éloignées l'une de l'autre, il est
Comment le coronavirus est devenu un catalyseur de la science des données en médecine
Aujourd'hui, il y a deux directions clésapplication appliquée de la science des données en médecine - soins de santé et produits pharmaceutiques. La première direction comprend les tâches de diagnostic, l'optimisation du travail des cliniques et des médecins, la sélection des médicaments et des traitements basés sur le diagnostic. Les solutions utilisées dans chacun de ces problèmes mondiaux sont basées sur des algorithmes d’analyse de données et d’apprentissage automatique. Les données médicales accumulées sont activement utilisées dans le développement de médicaments. Nous parlons à la fois de l'utilisation dans la recherche de substances actives et des tests de médicaments sur les animaux et les humains.
Un rôle particulier dans le développement des technologies Data Sciencejoué par la pandémie de coronavirus. Le besoin de modèles prédictifs qui pourraient fournir des données plus précises sur la propagation future du coronavirus s'est fortement accru : pour prédire le nombre d'hospitalisations, l'impact de certaines mesures restrictives et vaccinations sur le COVID-19. Et si en épidémiologie classique de telles prédictions sont basées sur des modèles épidémiologiques relativement simples, alors en réalité ces modèles se sont montrés extrêmement médiocres, alors que les méthodes modernes de Data Science sont capables de les remplacer et d'améliorer la précision des prédictions.
Les principaux domaines d'application de la Data Science enla médecine pendant la pandémie est restée la même, mais la quantité de données et le temps prévu pour résoudre le problème ont considérablement changé. Par exemple, la tâche de diagnostiquer une maladie par scanner des poumons est étudiée depuis longtemps, il existe un nombre suffisant de solutions fonctionnelles sur le marché. Mais grâce à la nature mondiale de la pandémie, à l'échange constant de données et à leur disponibilité, la tâche de diagnostic automatique de COVID-19 par CT a été résolue dans les plus brefs délais. Il en va de même pour prédire la gravité de l'issue de la maladie, ce qui pourrait aider à prévoir le nombre de lits d'hôpitaux disponibles. Pour résoudre ce problème, une énorme quantité de données est collectée et analysée dans plusieurs pays en parallèle. Mais la spécificité de la médecine est telle que l'introduction de nouvelles solutions est pratiquement impossible. Comme pour les vaccins, des tests minutieux de tout modèle sont nécessaires avant que les décisions médicales puissent en dépendre.
Quelles sont les connaissances de base nécessaires pour travailler en Data Science :
- Mathématiques supérieures : algèbre linéaire, analyse mathématique, statistiques.
- Comment fonctionnent les méthodes d'apprentissage automatique.
Comment la science des données aide à lutter contre le cancer, la maladie d'Alzheimer et les nouveaux médicaments
Examinons différents domaines d'applicationScience des données en médecine. L’un des plus prometteurs est le diagnostic du cancer. Aujourd’hui, les data scientists utilisent toute une gamme d’algorithmes pour développer des solutions dans ce domaine : le choix d’une méthode spécifique dépend de la tâche à accomplir, des données disponibles et de leur volume. Par exemple, vous pouvez effectuer des diagnostics à l'aide d'images de tumeurs. Dans ce cas, les spécialistes de la science des données utiliseront très probablement des réseaux de neurones. Pour le diagnostic, sur la base des résultats de l'analyse, l'une des méthodes d'apprentissage automatique la mieux adaptée à une tâche spécifique sera sélectionnée. Il existe également des algorithmes spécifiques utilisés, par exemple, pour analyser les données ADN obtenues à partir de cellules individuelles. Ces données sont le plus souvent analysées à l’aide d’algorithmes graphiques. Mais c'est plutôt une exception à la règle.
De plus, plusieurs méthodes sont appliquéespour améliorer les images et améliorer la précision du résultat. Les plateformes de Big Data (telles que Hadoop) utilisent, par exemple, MapReduce pour trouver des paramètres pouvant être utilisés dans diverses tâches. Pour ceux qui vont développer leur propre produit dans ce domaine, ou simplement pour les passionnés, il existe plusieurs jeux de données d'imagerie cérébrale ouverts : BrainWeb, IXI Dataset, fastMRI et OASIS.
Un autre cas est la modélisation d'organeshumaine, l'une des tâches techniques les plus difficiles. De plus, lors du développement d'une solution particulière, un spécialiste doit comprendre exactement pourquoi et à quel niveau de complexité l'organe est modélisé. Par exemple, vous pouvez créer un modèle d'une tumeur spécifique au niveau de l'expression des gènes et des voies de signalisation. Aujourd'hui, la société Insilico Medicine résout de tels problèmes. Cette approche est utilisée pour trouver la cible de la thérapie, y compris par des méthodes de Data Science. De tels modèles sont principalement utilisés pour la recherche scientifique, ils sont encore loin d'une application pratique.
Analyse de séquence de gènes - ensembleune direction de la médecine dont le développement est tout simplement impossible sans Data Science. Si les compétences en programmation Python sont extrêmement importantes en Data Science, alors travailler avec des gènes nécessite également une connaissance du langage de programmation R et des outils bioinformatiques spécifiques - des programmes pour travailler avec des séquences d'ADN et de protéines. La plupart de ces programmes fonctionnent sur le système d'exploitation Unix et ne sont pas très conviviaux. Pour les maîtriser, il faut au moins comprendre les bases de la biologie moléculaire et de la génétique. Malheureusement, même dans les facultés de médecine d'aujourd'hui, cela pose de gros problèmes, et la plupart des médecins ont en fait une mauvaise idée du fonctionnement des séquences génétiques. En Russie, deux sociétés sont engagées dans ce domaine - Atlas et Genotech. L'analyse des mutations de gènes individuels est également populaire à l'heure actuelle. La plupart des grandes sociétés d'analyses médicales proposent de tels services. Les patientes, par exemple, peuvent découvrir si elles ont une prédisposition au cancer du sein dans les mêmes gènes qu'Angelina Jolie. Cette zone est caractérisée par une pénurie de personnel, car il n'y a que quelques endroits où vous pouvez obtenir une éducation appropriée. En outre, beaucoup restent pour travailler dans le domaine scientifique ou partent à l'étranger. Il existe peu de ressources en ligne en russe où vous pouvez apprendre une telle analyse. Ils s'adressent généralement aux médecins ou aux biologistes et n'enseignent que la programmation et la manipulation de données de base. Afin d'obtenir une formation plus axée sur la pratique avec accès à ce domaine, vous pouvez suivre un cours à la Faculté des sciences des données en médecine de GeekBrains.
Il en existe plusieurs sur le marché aujourd'huioutils d'analyse de données dans ce domaine : MapReduce, SQL, Galaxy, Bioconductor. MapReduce traite les données génétiques et réduit le temps nécessaire au traitement des séquences génétiques.
SQL est le langage de base de données relationnelle que noussont utilisés pour interroger et récupérer des données à partir de bases de données génomiques. Galaxy est une application de recherche biomédicale basée sur une interface graphique open source. Il vous permet d'effectuer diverses opérations avec les génomes.
Enfin, Bioconductor est un logiciel open source conçu pour l'analyse de données génomiques.
Commercial important et en même tempsdirection de la recherche - la création de médicaments de nouvelle génération. Les spécialistes pharmaceutiques utilisent l’apprentissage automatique pour rechercher des cibles thérapeutiques et des biomarqueurs. Bien entendu, ni la première ni la seconde ne sont les drogues elles-mêmes. Les cibles sont des molécules du corps avec lesquelles un médicament interagit, et les biomarqueurs sont des molécules qui indiquent au médecin qui doit utiliser le médicament. Par conséquent, presque toutes les entreprises qui développent des médicaments contre des maladies dont les cibles et les biomarqueurs sont inconnus - Novartis, Merck, Roche et la société russe BIOCAD - utilisent l'apprentissage automatique. Il s'agit tout d'abord du cancer et des maladies auto-immunes, la maladie d'Alzheimer. Cela inclut également la recherche de nouveaux antibiotiques.
Pourquoi les médecins ne favorisent pas la mise en œuvre de la science des données
Ces dernières années ont montré que la science des donnéesest le moteur de l'industrie des modèles prédictifs et analytiques en médecine, par exemple, dans l'application des réseaux neuronaux pour déterminer la structure spatiale des protéines. Mais la pandémie a révélé un problème mondial dans de nombreux pays lié à l'optimisation des ressources cliniques et au manque de personnel. Au cours de la dernière année, de nombreuses entreprises ont vu le jour en proposant des solutions à ces problèmes grâce à la science des données. L'utilisation des données est devenue une grande avancée pour les cliniques privées, car elle rend les services médicaux moins chers. Dans le contexte de la pandémie, la demande de services de télémédecine a également augmenté, dans laquelle les algorithmes d'apprentissage automatique sont largement utilisés. Les services de télémédecine sont demandés pour un diagnostic préalable, en travaillant avec des analyses et en créant des chatbots.
En termes de limites technologiquesl’application de la vision par ordinateur et de l’apprentissage automatique ne rencontre pratiquement aucune barrière. Une mise en œuvre plus approfondie des algorithmes et des services dépend de la volonté des cliniques et des médecins d'appliquer les méthodes de la science des données. Il existe également une grave pénurie de données sur la formation, et c'est un problème non seulement pour les établissements de santé commerciaux, mais aussi pour l'État : les gouvernements devraient démocratiser l'accès aux données des hôpitaux publics afin que les sociétés de développement puissent créer des produits modernes.
Apprendre ne serait-ce qu'un seul programme demande beaucoupdonnées de qualité. Afin d'apprendre à distinguer une tumeur dans un cadre, le programme a besoin de milliers d'images de patients analysées manuellement, et des médecins expérimentés doivent être impliqués dans l'analyse.
Le médecin doit d'abord trouver la tumeur, puismontrer où elle est. Comme vous pouvez l'imaginer, les médecins expérimentés ont bien d'autres choses à faire. Mais la pandémie, assez curieusement, a aidé certaines régions. Par exemple, DiagnoCat, une startup russe qui utilise la vision par ordinateur pour analyser des images en dentisterie, a réussi à attirer des médecins inoccupés pour analyser des images pendant le confinement. Quant à la réticence des cliniques et des médecins, les médecins ne font tout simplement pas confiance à ces technologies. Un bon médecin trouvera sûrement un tel cas lorsque le programme pose un mauvais diagnostic, un médecin inexpérimenté a peur que le programme fasse tout mieux que lui. De ce fait, vous pouvez toujours vous justifier en vous souciant des aspects patient et juridique.
Synergie de la science des données et des technologies médicalesnous a déjà permis de faire un bond en avant dans le développement de solutions pour le diagnostic du cancer, des maladies auto-immunes et neurodégénératives. Les services alimentés par l'analyse de données et l'apprentissage automatique sont capables de prédire la propagation des virus et de rechercher de nouvelles générations de médicaments. Malgré le fait que l'enseignement médical classique soit en retard par rapport aux défis auxquels l'industrie est confrontée aujourd'hui, il est réel de devenir un spécialiste moderne travaillant à la jonction de deux domaines scientifiques - la science des données et la médecine. Et une façon est le cours en ligne à la Faculté des sciences des données en médecine de GeekBrains.
Voir aussi:
Nébuleuses, comètes et pépinières d'étoiles : montrer la meilleure astrophotographie de l'année
Les données des satellites espions ont aidé à découvrir la cause de la fonte des glaciers en Asie
Coronavirus dans une grotte : tout sur les mineurs chinois qui ont souffert d'une étrange pneumonie en 2012