Ο δικός σας δάσκαλος: πώς μαθαίνουν οι αλγόριθμοι χωρίς ανθρώπινη βοήθεια και κάνουν τα drones καλύτερα

Τα μη επανδρωμένα οχήματα, τα ψηφιακά δίδυμα και ο αυτόματος έλεγχος των τηλεπικοινωνιών δεν είναι

προβλέψεις συγγραφέων επιστημονικής φαντασίας, και ήδηπροβλέψιμο μέλλον. Το φέρνουν πιο κοντά επιστήμονες που ασχολούνται με την εφαρμοσμένη τεχνητή νοημοσύνη και την έρευνα στον τομέα της ενισχυτικής μάθησης. Η Hi-Tech μίλησε για το μέλλον της τεχνολογίας με τους Oleg Svidchenko, Alexander Grishin και Alexey Shpilman, νικητές του ετήσιου βραβείου Segalovich.

Πώς μαθαίνει η τεχνητή νοημοσύνη χωρίς μέντορα

Ενισχυτική μάθηση,RL) υποθέτει ότι το ίδιο το AI αλληλεπιδρά με ένα συγκεκριμένο περιβάλλον - για παράδειγμα, έναν πίνακα για το παιχνίδι Go ή τον έξω κόσμο εάν το ρομπότ κινείται κατά μήκος του. Η συσκευή πρέπει να αναγνωρίζει κοινά μοτίβα και να εστιάζει σε αυτά κατά την εκτέλεση εργασιών. Και όταν μαθαίνετε με έναν "δάσκαλο" χρειάζεστε ένα άτομο που πρέπει να υποδείξει τη σωστή ενέργεια στην οποία θα εκπαιδεύσει το AI.

«Η ουσία του RL είναι ότι το μηχάνημα ή, όπως λέμε,πράκτορας, μαθαίνει με τον τρόπο της συνεχούς πρακτικής», σημειώνει ο Oleg Svidchenko, βραβευμένος με το Yandex Science Prize. - Το AI τοποθετείται σε συγκεκριμένες συνθήκες και «λέω» - πράττω. Αυτό είναι παρόμοιο με την κατάσταση όταν ένα ποντίκι ψάχνει για τυρί σε έναν λαβύρινθο. Έχοντας κάνει μια στροφή προς τη λάθος κατεύθυνση, το ζώο συγκρούεται με τον τοίχο, επιστρέφει, προσπαθεί ξανά και ούτω καθεξής. Στην περίπτωση της ενισχυτικής μάθησης, τα σωστά βήματα ανταμείβονται. Όσο πιο σωστή είναι η ενέργεια, τόσο περισσότερους πόντους θα λάβει το AI. Εάν η επιλογή αποδειχτεί λανθασμένη, τότε ο πράκτορας χάνει πόντους. Κατά τη διάρκεια της εκπαίδευσης, το μηχάνημα θυμάται ποιος συνδυασμός ενεργειών ήταν πιο κερδοφόρος και την επόμενη φορά θα τον χρησιμοποιήσει».

Η ανεξάρτητη αναζήτηση λύσης επιτρέπει στον πράκτορααργά ή γρήγορα ξεπεράσει τον άντρα. Αυτό φάνηκε, για παράδειγμα, από τον αλγόριθμο MuZero της DeepMind, ο οποίος έμαθε να παίζει δεκάδες παλιά βιντεοπαιχνίδια Atari, σκάκι και επιτραπέζια παιχνίδια τύπου Go. Για να το δημιουργήσουν, χρησιμοποίησαν προηγούμενες εξελίξεις της εταιρείας: για παράδειγμα, το AlphaGo, χάρη στο οποίο ήταν δυνατό να νικήσει τον πρωταθλητή Go Lee Sedol και το AlphaZero, το οποίο χρησιμοποιείται στο σκάκι. Ο βελτιωμένος αλγόριθμος εξάγει περισσότερες πληροφορίες από λιγότερα δεδομένα - τώρα χρειάζεται τα μισά βήματα εκπαίδευσης.

Οι αλγόριθμοι ενίσχυσης μάθησης μπορούνχρήσιμο σε διάφορους κλάδους. Για παράδειγμα, στην ιατρική - για την οργάνωση εξατομικευμένης δυναμικής θεραπείας, στη βιομηχανία ψυχαγωγίας - για αυτόματη δοκιμή παιχνιδιών υπολογιστή ή στην αεροπορία - για αυτόνομο έλεγχο ενός στρατοσφαιρικού μπαλονιού.

Σε ποιους τομείς η τεχνητή νοημοσύνη θα βοηθήσει τους ανθρώπους

Ψηφιοποίηση λιανικού εμπορίου: πλήρως αυτοματοποιημένα καταστήματα

Ο πρώτος που εφάρμοσε τη μηχανική μάθηση σε βιομηχανίεςόπου γίνεται αποσφαλμάτωση της διαδικασίας συλλογής και ψηφιοποίησης μεγάλων ποσοτήτων δεδομένων. Για παράδειγμα, στο λιανικό εμπόριο, όλες οι πληροφορίες περνούν από ταμειακές μηχανές, πράγμα που σημαίνει ότι η τεχνητή νοημοσύνη έχει κάτι να συνεργαστεί. Σύμφωνα με τον Alexey Shpilman, η χρήση αλγορίθμων AI θα καταστήσει δυνατή τη δημιουργία αυτοματοποιημένων καταστημάτων παντού, όπου όλες οι διαδικασίες θα πραγματοποιούνται χωρίς ανθρώπινη παρέμβαση.

Αυτή η μορφή δοκιμάστηκε το 2016.εταιρεία Amazon. Ο αγοραστής παίρνει το καλάθι, παίρνει τα αγαθά σε αυτό και απλά φεύγει - τα χρήματα για την αγορά χρεώνονται αυτόματα από την κάρτα. Στη Ρωσία, ένα παρόμοιο έργο αναπτύχθηκε από τον Azbuka Vkusa.

"Ο αγοραστής παίρνει το τρόλεϊ, παίρνει τα αγαθά σε αυτό και απλά φεύγει - τα χρήματα για την αγορά χρεώνονται αυτόματα από την κάρτα"

Διαχείριση τηλεπικοινωνιών: εντοπισμός σφαλμάτων δικτύου 

Χάρη στην ενισχυτική μάθησητεχνολογικές ανακαλύψεις μπορούν να συμβούν στη διαχείριση διαφόρων δικτύων - τηλεπικοινωνίες, δίκτυα θέρμανσης, βιομηχανία ηλεκτρικής ενέργειας. Πολλές διαδικασίες εδώ είναι αρκετά εύκολο να ρομποτικοποιηθούν, καθώς δεν υπάρχει μεγάλη αλληλεπίδραση με τους ανθρώπους.

Ο αυτοματισμός θα οδηγήσει στη δημιουργία συστημάτων πουθα λάβει πιο τεκμηριωμένες αποφάσεις και θα βελτιστοποιήσει την κατανάλωση ενέργειας. Για παράδειγμα, με βάση τους αλγόριθμους RL, αναπτύσσεται ένας ελεγκτής HVAC (ακρωνύμιο για Θέρμανση, Αερισμός, & Κλιματισμός - Θέρμανση, εξαερισμός και κλιματισμός) - αυτό είναι ένα σύστημα ελέγχου θερμοκρασίας και αερισμού δωματίου. Η χρήση αυτής της τεχνολογίας στις επιχειρήσεις θα βοηθήσει τόσο στην εξοικονόμηση ενέργειας όσο και στη μείωση των εκπομπών άνθρακα.

Μη επανδρωμένα οχήματα: Τεχνολογία δοκιμών και νομοθεσία

Ένας άλλος τομέας που περιμένει μια σημαντική ανακάλυψη χάρη σεενισχυτική μάθηση – μεταφορά. Ήδη σήμερα, μη επανδρωμένα οχήματα και ρομπότ παράδοσης μπορούν να βρεθούν στους δρόμους. Παρά τις τεχνολογικές προόδους στον κλάδο, οι αναλυτές της McKinsey προβλέπουν ότι τα drones δεν θα γίνουν mainstream μέχρι το 2030 το νωρίτερο. Η εφαρμογή περιπλέκεται από την ανάγκη ανάπτυξης κανονισμών. Στη Σιγκαπούρη και τις Ηνωμένες Πολιτείες, οι αυτοματοποιημένες μεταφορές βρίσκονται ήδη σε πλήρη εξέλιξη κατά μήκος των αυτοκινητοδρόμων και πρόσφατα εμφανίστηκε η άδεια για δοκιμή ενός μη επανδρωμένου ταξί στη Ρωσία.

«Ο αυτοματισμός βελτιώνει σχεδόν πάντα το επίπεδοασφάλεια, αλλά ο κόσμος χαιρετίζει την εισαγωγή τέτοιων τεχνολογιών με ανησυχία», είναι σίγουρος ο Oleg Svidchenko. — Εάν αντικαταστήσετε όλα τα μέσα μεταφοράς με μη επανδρωμένα Teslas, ο αριθμός των ατυχημάτων στους δρόμους θα μειωθεί αρκετές φορές. Αλλά κάθε ατύχημα θα εγείρει πολλά ερωτήματα. Δεν μπορούμε να πούμε με βεβαιότητα, όπως στην περίπτωση ενός ατόμου, τι προκάλεσε το ατύχημα. Και οι άνθρωποι φοβούνται αυτό το άγνωστο».

«Ένας άλλος τομέας που περιμένει μια σημαντική ανακάλυψη χάρη στην ενισχυτική μάθηση είναι οι μεταφορές»

Πώς τα ψηφιακά δίδυμα θα είναι χρήσιμα στην ανθρωπότητα

Οι αλγόριθμοι ενισχυτικής μάθησης το κατέστησαν δυνατόδημιουργήστε ψηφιακά δίδυμα - εικονικά πρωτότυπα αντικειμένων, διαδικασιών, ακόμη και ανθρώπων που περιέχουν τις ίδιες ιδιότητες και χαρακτηριστικά με τα πρωτότυπα. Οι βιομηχανικές επιχειρήσεις χρησιμοποιούν αυτήν την τεχνολογία, για παράδειγμα, για να ελέγξουν εάν όλες οι διεργασίες έχουν προσαρμοστεί σωστά πριν ξεκινήσουν έναν νέο μεταφορέα. Φυσικά, μπορείτε να τοποθετήσετε αμέσως το βύσμα στην πρίζα, αλλά εάν παρουσιαστεί βλάβη, θα χρειαστεί χρόνος και πόροι για να το διορθώσετε. Επομένως, ο μεταφορέας εκκινείται πρώτα σε υπολογιστή. 

Όλα είναι πολύ καλύτερα με τα ανθρώπινα ψηφιακά δίδυμαπιο δύσκολο, γιατί ένας ζωντανός οργανισμός είναι ένα πιο περίπλοκο σύστημα. Κι όμως, οι επιστήμονες συνεχίζουν να κυριαρχούν στην τεχνολογία, δημιουργώντας εικονικά αντίγραφα τόσο μεμονωμένων οργάνων όσο και ολόκληρου του οργανισμού. Για παράδειγμα, ένα νοσοκομείο της Βοστώνης χρησιμοποιεί ένα ψηφιακό δίδυμο της καρδιάς για να προγραμματίσει χειρουργικές επεμβάσεις. Στο μέλλον, αυτό θα επιτρέψει τη δοκιμή μεθόδων θεραπείας σε έναν εικονικό ασθενή, την πρόβλεψη ασθενειών και μπορεί κάλλιστα να ισχυριστεί ότι είναι μια επανάσταση στην ιατρική.

«Η ανάπτυξη της τεχνητής νοημοσύνης, συμπεριλαμβανομένου του RL, θα μπορούσε να οδηγήσει σετο γεγονός ότι οι άνθρωποι θα αρχίσουν να καταλαβαίνουν καλύτερα τον εαυτό τους», προτείνει ο Aleksey Shpilman. «Ο άνθρωπος είναι ένα κλειστό σύστημα, γιατί χρησιμοποιούμε τον εγκέφαλό μας για αυτογνωσία. Μας αρκεί όμως αυτό το εργαλείο; Ακόμα και στην ψυχολογία χρειάζονται δύο άνθρωποι για αναστοχασμό και είμαστε κλειστοί μέσα μας. Παγκοσμίως, στο πλαίσιο του Σύμπαντος, η ανθρωπότητα είναι ακόμα μόνη, πράγμα που σημαίνει ότι δεν έχουμε κανέναν να μιλήσουμε για να μάθουμε κάτι νέο για τον εαυτό μας και να κοιτάξουμε από έξω. Ίσως, χάρη στην ενισχυτική μάθηση, να δημιουργήσουμε κάποιο είδος οντότητας έξω από εμάς. Δεν θα περιορίζεται από τον εγκέφαλο και τη συνείδησή μας και θα μπορεί να δώσει σε ένα άτομο νέες απαντήσεις και νοήματα».

Γιατί η ευρεία εφαρμογή του RL είναι ακόμα περιορισμένη

Παρά την πρόοδο που έχουν σημειώσει οι επιστήμονες, η πρακτική εφαρμογή του RL εξακολουθεί να είναι περιορισμένη. Το σύστημα χρειάζεται πολύ χρόνο για να μάθει και κάνει πολλά λάθη, επομένως η εφαρμογή του αλγορίθμου παντού είναι δύσκολη και ασύμφορη.

«Ο πράκτορας χρειάζεται περισσότερες επαναλήψεις, οπότε η διαδικασίαΗ εκμάθηση διαρκεί αρκετά, - εξηγεί ο Alexander Grishin - Επιπλέον, δεν αρκεί η τεχνητή νοημοσύνη να εκτελέσει την καλύτερη ενέργεια. Πρέπει να εξερευνήσει το περιβάλλον, καθώς μια μεγάλη ανταμοιβή μπορεί να κρύβεται πίσω από τις επί του παρόντος μη ελκυστικές κινήσεις. Η όλη λογική της ενισχυτικής μάθησης καταλήγει στο γεγονός ότι η τεχνητή νοημοσύνη μαθαίνει να θυσιάζει τα βραχυπρόθεσμα οφέλη για τη μακροπρόθεσμη επιτυχία. Για να το κάνετε αυτό, πρέπει να σκεφτείτε εκ των προτέρων και να υπολογίσετε πιθανά σενάρια για την εξέλιξη των γεγονότων. Για παράδειγμα, όταν ο πράκτορας παραιτηθεί από τον ιππότη για να συλλάβει τη βασίλισσα, οι επιστήμονες θα είναι πολύ χαρούμενοι».

Το καθήκον των επιστημόνων είναι να διασφαλίσουν ότι η τεχνητή νοημοσύνη αναπτύσσεταιρυθμός μάθησης και βελτιωμένη ικανότητα ανάλυσης. Αλλά ένα εγκόσμιο πρόβλημα εμποδίζει την ταχεία πρόοδο: υπάρχει έλλειψη προσωπικού σε εργαστήρια Ε&Α και σε εταιρείες πληροφορικής. Τα πανεπιστήμια δημιουργούν εργαστήρια και ερευνητικά κέντρα, οι κολοσσοί της τεχνολογίας ανοίγουν εξειδικευμένα μαθήματα.

«Έρευνα στη μηχανική μάθηση τώραπολύ σε ζήτηση. Η βιομηχανία αναπτύσσεται γρήγορα και η έλλειψη προσωπικού αυξάνεται καθημερινά», λέει ο Alexey Shpilman. «Οι ειδικοί έχουν μια μεγάλη ευκαιρία να εμπλακούν σε διαδικασίες που θα αλλάξουν τον κόσμο πέρα ​​από την αναγνώριση. Πολλές ενδιαφέρουσες δουλειές. Τώρα βρισκόμαστε στην αρχή του μονοπατιού, αλλά έχουμε ήδη πετύχει καλά αποτελέσματα. Μπορείτε να φανταστείτε τι προοπτικές θα ανοίξει για την ανθρωπότητα μέσω της χρήσης του RL;

Διαβάστε περισσότερα:

Το διαστημικό σκάφος πέταξε 200 χιλιόμετρα από τον Ερμή. Δείτε τι είδε

Οι επιστήμονες αποκαλύπτουν πώς οι βιταμίνες επηρεάζουν την εμφάνιση καρκίνου

Το κινεζικό κράνος ανάγνωσης μυαλού κρούει τον κώδωνα του κινδύνου όταν ένα άτομο βλέπει περιεχόμενο πορνό