Η βάση δεδομένων DeepMind περιελάμβανε σχεδόν κάθε πρωτεΐνη που είναι γνωστή στην επιστήμη. Περίπου 200 εκατομμύρια

Πέρυσι, η DeepMind κυκλοφόρησε μια βάση δεδομένων ανοιχτού κώδικα που περιέχει εκατοντάδες χιλιάδες τρισδιάστατες δομές

πρωτεϊνών, συμπεριλαμβανομένων και των 20.000 γνωστών πρωτεϊνώνανθρώπινο σώμα. Τώρα αυτή η βάση δεδομένων AlphaFold Protein Structure έχει επεκταθεί σε 200 εκατομμύρια δομές, συμπεριλαμβανομένων σχεδόν όλων των πρωτεϊνών που είναι γνωστές στην επιστήμη. Συζητήστε

Οι πρωτεΐνες αποτελούνται από αλυσίδες αμινοξέων πουδιπλώστε σε περίπλοκα τρισδιάστατα σχήματα που καθορίζουν τη λειτουργία τους. Η χαρτογράφηση των δομών των πρωτεϊνών είναι σημαντική για την κατανόηση του τι κάνουν και πώς λειτουργούν και πώς τα πράγματα μπορεί να πάνε στραβά. Ωστόσο, εξακολουθεί να είναι δύσκολο να υπολογιστεί η ακριβής δομή μιας πρωτεΐνης με βάση τα συστατικά της αμινοξέα. Αυτό συνήθως απαιτεί τεράστια υπολογιστική ισχύ και ανθρωποώρες.

Αυτό ίσχυε μέχρι την Alphabetέχει κατευθύνει την ισχυρή τεχνητή νοημοσύνη DeepMind της για να λύσει αυτό το πρόβλημα. Αρχικά εκπαιδευμένο σε 100.000 γνωστές πρωτεϊνικές δομές, το σύστημα έχει αναπτύξει την ικανότητα να προβλέπει τις δομές πολλών εκατομμυρίων άλλων πρωτεϊνών, καθεμία από τις οποίες χρειάζεται λεπτά ή δευτερόλεπτα για να προσδιοριστεί, αντί για μήνες ή χρόνια.

Πρόσφατα, η DeepMind κυκλοφόρησε μια νέα μεγάλης κλίμακαςενημέρωση της βάσης δεδομένων, η οποία περιλαμβάνει πλέον περίπου 214 εκατομμύρια δομές από ένα εκατομμύριο είδη. Αυτό καλύπτει σχεδόν κάθε πρωτεΐνη που είναι γνωστή στην επιστήμη, η οποία είναι τεράστια βοήθεια για την έρευνα σε θεραπείες ασθενειών, εμβόλια, αντίσταση στα αντιβιοτικά, ακόμη και πλαστική ρύπανση.

Ολόκληρη η βάση δεδομένων δομής πρωτεϊνών με περισσότερα από 25 terabyte δεδομένων μπορεί να ληφθεί από το Google Cloud Public Datasets.