Πέρυσι, η DeepMind κυκλοφόρησε μια βάση δεδομένων ανοιχτού κώδικα που περιέχει εκατοντάδες χιλιάδες τρισδιάστατες δομές
Οι πρωτεΐνες αποτελούνται από αλυσίδες αμινοξέων πουδιπλώστε σε περίπλοκα τρισδιάστατα σχήματα που καθορίζουν τη λειτουργία τους. Η χαρτογράφηση των δομών των πρωτεϊνών είναι σημαντική για την κατανόηση του τι κάνουν και πώς λειτουργούν και πώς τα πράγματα μπορεί να πάνε στραβά. Ωστόσο, εξακολουθεί να είναι δύσκολο να υπολογιστεί η ακριβής δομή μιας πρωτεΐνης με βάση τα συστατικά της αμινοξέα. Αυτό συνήθως απαιτεί τεράστια υπολογιστική ισχύ και ανθρωποώρες.
Αυτό ίσχυε μέχρι την Alphabetέχει κατευθύνει την ισχυρή τεχνητή νοημοσύνη DeepMind της για να λύσει αυτό το πρόβλημα. Αρχικά εκπαιδευμένο σε 100.000 γνωστές πρωτεϊνικές δομές, το σύστημα έχει αναπτύξει την ικανότητα να προβλέπει τις δομές πολλών εκατομμυρίων άλλων πρωτεϊνών, καθεμία από τις οποίες χρειάζεται λεπτά ή δευτερόλεπτα για να προσδιοριστεί, αντί για μήνες ή χρόνια.
Πρόσφατα, η DeepMind κυκλοφόρησε μια νέα μεγάλης κλίμακαςενημέρωση της βάσης δεδομένων, η οποία περιλαμβάνει πλέον περίπου 214 εκατομμύρια δομές από ένα εκατομμύριο είδη. Αυτό καλύπτει σχεδόν κάθε πρωτεΐνη που είναι γνωστή στην επιστήμη, η οποία είναι τεράστια βοήθεια για την έρευνα σε θεραπείες ασθενειών, εμβόλια, αντίσταση στα αντιβιοτικά, ακόμη και πλαστική ρύπανση.
Ολόκληρη η βάση δεδομένων δομής πρωτεϊνών με περισσότερα από 25 terabyte δεδομένων μπορεί να ληφθεί από το Google Cloud Public Datasets.