Παρά το γεγονός ότι από μεθοδολογική άποψη, η πληροφορική και η ιατρική απέχουν αρκετά το ένα από το άλλο, είναι
Πώς ο Κοροναϊός έγινε καταλύτης για την επιστήμη δεδομένων στην ιατρική
Σήμερα υπάρχουν δύο βασικές κατευθύνσειςΕφαρμοσμένη εφαρμογή της Επιστήμης Δεδομένων στην ιατρική - υγειονομική περίθαλψη και φαρμακευτικά προϊόντα. Η πρώτη κατεύθυνση περιλαμβάνει διαγνωστικά καθήκοντα, βελτιστοποίηση του έργου κλινικών και γιατρών, επιλογή φαρμάκων και θεραπειών με βάση τη διάγνωση. Οι λύσεις που χρησιμοποιούνται σε καθένα από αυτά τα παγκόσμια προβλήματα βασίζονται σε αλγόριθμους ανάλυσης δεδομένων και μηχανικής μάθησης. Τα συσσωρευμένα ιατρικά δεδομένα χρησιμοποιούνται ενεργά στην ανάπτυξη φαρμάκων. Μιλάμε τόσο για χρήση στην αναζήτηση δραστικών ουσιών όσο και για δοκιμή φαρμάκων σε ζώα και ανθρώπους.
Ένας ειδικός ρόλος στην ανάπτυξη τεχνολογιών Επιστήμης Δεδομένωνέπαιξε από την πανδημία του ιού κοροναϊού. Η ανάγκη για μοντέλα πρόβλεψης που θα μπορούσαν να παρέχουν ακριβέστερα δεδομένα σχετικά με τη μελλοντική εξάπλωση του κορανοϊού έχει αυξηθεί απότομα: για να προβλέψουμε τον αριθμό των νοσοκομειακών νοσοκομείων, τον αντίκτυπο ορισμένων περιοριστικών μέτρων και εμβολιασμών στο COVID-19. Και εάν στην κλασική επιδημιολογία τέτοιες προβλέψεις βασίζονται σε σχετικά απλά επιδημιολογικά μοντέλα, τότε στην πραγματικότητα αυτά τα μοντέλα έχουν εμφανιστεί εξαιρετικά κακά, ενώ οι σύγχρονες μέθοδοι Επιστήμης Δεδομένων είναι σε θέση να τις αντικαταστήσουν και να βελτιώσουν την ακρίβεια των προβλέψεων.
Οι κύριοι τομείς εφαρμογής της Επιστήμης Δεδομένων στοφάρμακο κατά τη διάρκεια της πανδημίας παρέμεινε το ίδιο, αλλά η ποσότητα των δεδομένων και ο αναμενόμενος χρόνος για την επίλυση του προβλήματος έχουν αλλάξει σημαντικά. Για παράδειγμα, το έργο της διάγνωσης μιας νόσου από CT των πνευμόνων μελετήθηκε για μεγάλο χρονικό διάστημα · υπάρχει επαρκής αριθμός λύσεων εργασίας στην αγορά. Αλλά χάρη στην παγκόσμια φύση της πανδημίας, τη συνεχή ανταλλαγή δεδομένων και τη διαθεσιμότητά τους, το έργο της αυτόματης διάγνωσης του COVID-19 από CT επιλύθηκε το συντομότερο δυνατό. Το ίδιο ισχύει και για την πρόβλεψη της σοβαρότητας της έκβασης της νόσου, η οποία θα μπορούσε να βοηθήσει στην πρόβλεψη του αριθμού των διαθέσιμων νοσοκομειακών κλινών. Για την επίλυση αυτού του προβλήματος, συλλέγεται και αναλύεται τεράστιος αριθμός δεδομένων σε πολλές χώρες παράλληλα. Όμως η ιδιαιτερότητα της ιατρικής είναι τέτοια ώστε η εισαγωγή νέων λύσεων είναι πρακτικά αδύνατη. Όπως με τα εμβόλια, απαιτείται προσεκτικός έλεγχος οποιουδήποτε μοντέλου προτού εξαρτηθούν οι ιατρικές αποφάσεις.
Ποιες βασικές γνώσεις απαιτούνται για να εργαστούν στην Επιστήμη Δεδομένων:
- Ανώτερα μαθηματικά: γραμμική άλγεβρα, μαθηματική ανάλυση, στατιστικά.
- Πώς λειτουργούν οι μέθοδοι μηχανικής μάθησης.
Πώς το Science Science βοηθά στην καταπολέμηση του καρκίνου, του Αλτσχάιμερ και της εύρεσης νέων ναρκωτικών
Ας δούμε διάφορους τομείς εφαρμογήςΕπιστήμη Δεδομένων στην Ιατρική. Ένα από τα πιο ελπιδοφόρα είναι η διάγνωση του καρκίνου. Σήμερα, οι επιστήμονες δεδομένων χρησιμοποιούν μια ολόκληρη σειρά αλγορίθμων για να αναπτύξουν λύσεις σε αυτόν τον τομέα: η επιλογή μιας συγκεκριμένης μεθόδου εξαρτάται από την εργασία, τα διαθέσιμα δεδομένα και τον όγκο της. Για παράδειγμα, μπορείτε να κάνετε διαγνωστικά χρησιμοποιώντας εικόνες όγκου - σε αυτήν την περίπτωση, οι ειδικοί της Επιστήμης Δεδομένων πιθανότατα θα χρησιμοποιήσουν νευρωνικά δίκτυα. Για διαγνωστικά, με βάση τα αποτελέσματα της ανάλυσης, θα επιλεγεί μία από τις μεθόδους μηχανικής εκμάθησης που είναι πιο κατάλληλη για μια συγκεκριμένη εργασία. Υπάρχουν επίσης συγκεκριμένοι αλγόριθμοι που χρησιμοποιούνται, για παράδειγμα, για την ανάλυση δεδομένων DNA που λαμβάνονται από μεμονωμένα κύτταρα. Τέτοια δεδομένα αναλύονται συχνότερα χρησιμοποιώντας αλγόριθμους γραφημάτων. Αλλά αυτό είναι μάλλον μια εξαίρεση στον κανόνα.
Επιπλέον, εφαρμόζονται διάφορες μέθοδοιγια τη βελτίωση των εικόνων και τη βελτίωση της ακρίβειας του αποτελέσματος. Οι μεγάλες πλατφόρμες δεδομένων (όπως το Hadoop) χρησιμοποιούν, για παράδειγμα, το MapReduce για να βρουν παραμέτρους που μπορούν να χρησιμοποιηθούν σε διάφορες εργασίες. Για εκείνους που πρόκειται να αναπτύξουν το δικό τους προϊόν σε αυτόν τον τομέα, ή απλά λάτρεις, υπάρχουν πολλά σύνολα δεδομένων απεικόνισης ανοιχτού εγκεφάλου: BrainWeb, IXI Dataset, fastMRI και OASIS.
Μια άλλη περίπτωση είναι η μοντελοποίηση οργάνωνανθρώπινο, ένα από τα πιο δύσκολα τεχνικά καθήκοντα. Επιπλέον, όταν αναπτύσσει μια συγκεκριμένη λύση, ένας ειδικός πρέπει να καταλάβει ακριβώς γιατί και σε ποιο επίπεδο πολυπλοκότητας το όργανο μοντελοποιείται. Για παράδειγμα, μπορείτε να φτιάξετε ένα μοντέλο συγκεκριμένου όγκου στο επίπεδο των οδών έκφρασης και σηματοδότησης γονιδίων. Σήμερα η εταιρεία Insilico Medicine επιλύει τέτοια προβλήματα. Αυτή η προσέγγιση χρησιμοποιείται για την εύρεση του στόχου της θεραπείας, συμπεριλαμβανομένων των μεθόδων Επιστήμης Δεδομένων. Τέτοια μοντέλα χρησιμοποιούνται κυρίως για επιστημονική έρευνα · απέχουν ακόμη πολύ από την πρακτική εφαρμογή.
Ανάλυση ακολουθίας γονιδίων - Ολόκληρημια κατεύθυνση της ιατρικής, η ανάπτυξη της οποίας είναι απλώς αδύνατη χωρίς την Επιστήμη Δεδομένων. Εάν οι δεξιότητες προγραμματισμού Python είναι εξαιρετικά σημαντικές στην Επιστήμη Δεδομένων, τότε η εργασία με γονίδια απαιτεί επίσης γνώση της γλώσσας προγραμματισμού R και συγκεκριμένων εργαλείων βιοπληροφορικής - προγράμματα για εργασία με αλληλουχίες DNA και πρωτεϊνών. Τα περισσότερα από αυτά τα προγράμματα εκτελούνται στο λειτουργικό σύστημα Unix και δεν είναι πολύ φιλικά προς τον χρήστη. Για να τα μάθετε, πρέπει τουλάχιστον να κατανοήσετε τα βασικά της μοριακής βιολογίας και της γενετικής. Δυστυχώς, ακόμη και σε ιατρικές σχολές σήμερα, υπάρχουν μεγάλα προβλήματα με αυτό, και οι περισσότεροι γιατροί έχουν στην πραγματικότητα κακή ιδέα για το πώς λειτουργούν οι γονιδιακές αλληλουχίες. Στη Ρωσία, δύο εταιρείες ασχολούνται με αυτόν τον τομέα - Atlas και Genotech. Η ανάλυση για μεταλλάξεις μεμονωμένων γονιδίων είναι επίσης δημοφιλής αυτή τη στιγμή. Οι περισσότερες μεγάλες εταιρείες ιατρικής ανάλυσης παρέχουν τέτοιες υπηρεσίες. Οι ασθενείς, για παράδειγμα, μπορούν να μάθουν εάν έχουν προδιάθεση για καρκίνο του μαστού στα ίδια γονίδια με την Angelina Jolie. Αυτή η περιοχή χαρακτηρίζεται από έλλειψη προσωπικού, καθώς υπάρχουν μόνο λίγα μέρη όπου μπορείτε να λάβετε την κατάλληλη εκπαίδευση. Επιπλέον, πολλοί είτε μένουν για να εργαστούν στην επιστήμη είτε πηγαίνουν στο εξωτερικό. Υπάρχουν λίγοι διαδικτυακοί πόροι ρωσικής γλώσσας όπου μπορείτε να μάθετε μια τέτοια ανάλυση. Συνήθως απευθύνονται σε γιατρούς ή βιολόγους και διδάσκουν μόνο προγραμματισμό και βασικό χειρισμό δεδομένων. Για να αποκτήσετε μια πιο προσανατολισμένη στην πρακτική εκπαίδευση με πρόσβαση σε αυτόν τον τομέα, μπορείτε να ολοκληρώσετε ένα μάθημα στη Σχολή Επιστήμης Δεδομένων στην Ιατρική στο GeekBrains.
Υπάρχουν πολλά στην αγορά σήμεραεργαλεία ανάλυσης δεδομένων σε αυτόν τον τομέα: MapReduce, SQL, Galaxy, Bioconductor. Το MapReduce επεξεργάζεται γενετικά δεδομένα και μειώνει τον χρόνο που απαιτείται για την επεξεργασία των γενετικών αλληλουχιών.
Η SQL είναι η σχεσιακή γλώσσα της βάσης δεδομένων που εμείςχρησιμοποιούνται για την αναζήτηση και ανάκτηση δεδομένων από γονιδιωματικές βάσεις δεδομένων. Το Galaxy είναι μια βιοϊατρική ερευνητική εφαρμογή ανοιχτού κώδικα GUI. Σας επιτρέπει να εκτελείτε διάφορες επεμβάσεις με γονιδιώματα.
Τέλος, το Bioconductor είναι ένα λογισμικό ανοιχτού κώδικα που έχει σχεδιαστεί για την ανάλυση γονιδιωματικών δεδομένων.
Σημαντικό εμπορικό και ταυτόχροναερευνητική κατεύθυνση - δημιουργία φαρμάκων νέας γενιάς. Οι ειδικοί στη φαρμακευτική χρησιμοποιούν μηχανική μάθηση για να αναζητήσουν θεραπευτικούς στόχους και βιοδείκτες. Ούτε το πρώτο ούτε το δεύτερο, φυσικά, είναι τα ίδια τα φάρμακα. Οι στόχοι είναι μόρια στο σώμα με τα οποία αλληλεπιδρά ένα φάρμακο και οι βιοδείκτες είναι μόρια που λένε στον γιατρό ποιος πρέπει να χρησιμοποιήσει το φάρμακο. Επομένως, σχεδόν όλες οι εταιρείες που αναπτύσσουν φάρμακα για ασθένειες με άγνωστους στόχους και βιοδείκτες - η Novartis, η Merck, η Roche και η ρωσική BIOCAD - χρησιμοποιούν μηχανική μάθηση. Πρόκειται καταρχήν για τον καρκίνο και τα αυτοάνοσα νοσήματα, τη νόσο του Αλτσχάιμερ. Αυτό περιλαμβάνει επίσης την αναζήτηση νέων αντιβιοτικών.
Γιατί οι γιατροί δεν προωθούν την εφαρμογή της επιστήμης δεδομένων
Τα τελευταία χρόνια έχουν δείξει ότι η Επιστήμη των Δεδομένωνείναι ο κινητήρας της βιομηχανίας προγνωστικών και αναλυτικών μοντέλων στην ιατρική, για παράδειγμα, στην εφαρμογή νευρωνικών δικτύων για τον προσδιορισμό της χωρικής δομής των πρωτεϊνών. Αλλά η πανδημία έχει αποκαλύψει ένα παγκόσμιο πρόβλημα σε πολλές χώρες που σχετίζονται με τη βελτιστοποίηση των κλινικών πόρων και την έλλειψη προσωπικού. Κατά το παρελθόν έτος, πολλές εταιρείες ξεκίνησαν να προσφέρουν λύσεις σε αυτά τα προβλήματα με την Data Science. Η χρήση δεδομένων έχει γίνει μια σημαντική ανακάλυψη για ιδιωτικές κλινικές, καθώς καθιστά τις ιατρικές υπηρεσίες φθηνότερες. Στο πλαίσιο της πανδημίας, η ζήτηση για υπηρεσίες τηλεϊατρικής έχει επίσης αυξηθεί, όπου οι αλγόριθμοι μηχανικής μάθησης χρησιμοποιούνται ευρέως. Οι υπηρεσίες τηλεϊατρικής απαιτούν προκαταρκτική διάγνωση, συνεργάζονται με αναλύσεις και δημιουργούν bots συνομιλίας.
Όσον αφορά τους τεχνολογικούς περιορισμούςΗ εφαρμογή της όρασης υπολογιστών και της μηχανικής μάθησης δεν έχει ουσιαστικά κανένα εμπόδιο. Η βαθύτερη εφαρμογή αλγορίθμων και υπηρεσιών εξαρτάται από την επιθυμία των κλινικών και των γιατρών να εφαρμόσουν μεθόδους Data Science. Υπάρχει επίσης έντονη έλλειψη δεδομένων κατάρτισης, και αυτό είναι ένα ζήτημα όχι μόνο για τα εμπορικά ιδρύματα υγειονομικής περίθαλψης, αλλά και για το κράτος: οι κυβερνήσεις θα πρέπει να εκδημοκρατίσουν την πρόσβαση στα δεδομένα των δημόσιων νοσοκομείων, ώστε οι εταιρείες ανάπτυξης να μπορούν να δημιουργήσουν σύγχρονα προϊόντα.
Η εκμάθηση ακόμη και ενός προγράμματος απαιτεί πολλάποιοτικά δεδομένα. Για να μάθετε πώς να διακρίνετε έναν όγκο σε ένα πλαίσιο, το πρόγραμμα χρειάζεται χιλιάδες εικόνες ασθενών που αναλύθηκαν χειροκίνητα και στην ανάλυση πρέπει να συμμετέχουν έμπειροι γιατροί.
Ο γιατρός πρέπει πρώτα να βρει τον όγκο και μετάδείξε πού είναι. Όπως μπορείτε να φανταστείτε, οι έμπειροι γιατροί έχουν πολλά να κάνουν. Αλλά η πανδημία, αρκετά παράξενα, βοήθησε ορισμένες περιοχές. Για παράδειγμα, το DiagnoCat, μια ρωσική εκκίνηση που χρησιμοποιεί το όραμα του υπολογιστή για την ανάλυση εικόνων στην οδοντιατρική, μπόρεσε να προσελκύσει μη κατειλημμένους γιατρούς να αναλύσουν εικόνες κατά τη διάρκεια ενός κλειδώματος. Όσον αφορά την απροθυμία κλινικών και ιατρών, οι γιατροί απλά δεν εμπιστεύονται τέτοιες τεχνολογίες. Ένας καλός γιατρός θα βρει σίγουρα μια τέτοια περίπτωση όταν το πρόγραμμα κάνει λάθος διάγνωση, ένας άπειρος γιατρός φοβάται ότι το πρόγραμμα θα κάνει τα πάντα καλύτερα από αυτόν. Ως αποτέλεσμα, μπορείτε πάντα να δικαιολογείτε τον εαυτό σας φροντίζοντας τον ασθενή και τις νομικές πτυχές.
Συνεργία Επιστήμης Δεδομένων και Ιατρικών Τεχνολογιώνμας έχει ήδη επιτρέψει να κάνουμε ένα άλμα προς τα εμπρός στην ανάπτυξη λύσεων για τη διάγνωση καρκίνου, αυτοάνοσων και νευροεκφυλιστικών ασθενειών. Οι υπηρεσίες που υποστηρίζονται από την ανάλυση δεδομένων και τη μηχανική μάθηση είναι σε θέση να προβλέψουν την εξάπλωση των ιών και να αναζητήσουν νέες γενιές ναρκωτικών. Παρά το γεγονός ότι η κλασική ιατρική εκπαίδευση υστερεί από τις προκλήσεις που αντιμετωπίζει η βιομηχανία σήμερα, είναι αληθινό να γίνει ένας σύγχρονος ειδικός που εργάζεται στη διασταύρωση δύο επιστημονικών τομέων - της Επιστήμης Δεδομένων και της Ιατρικής. Και ένας τρόπος είναι το διαδικτυακό μάθημα στη Σχολή Επιστήμης Δεδομένων στην Ιατρική στο GeekBrains.
Δείτε επίσης:
Νεφέλωμα, κομήτες και αστρικά φυτώρια: παρουσιάζοντας την καλύτερη αστροφωτογραφία της χρονιάς
Τα δεδομένα από κατασκοπευτικούς δορυφόρους βοήθησαν στην εύρεση της αιτίας της τήξης των παγετώνων στην Ασία
Coronavirus σε μια σπηλιά: όλα για τους κινέζους ανθρακωρύχους που υπέστησαν παράξενη πνευμονία το 2012