Το MIT έχει αναπτύξει έναν καθολικό αλγόριθμο για την πρόβλεψη του μέλλοντος

Πρόβλεψη των τιμών των δεικτών που αλλάζουν με την πάροδο του χρόνου, όπως ο καιρός, οι τιμές των μετοχών

ή ο κίνδυνος ανάπτυξης ασθένειας, πραγματοποιείται στιςμε βάση την ανάλυση ιστορικών δεδομένων. Για να δημιουργήσετε μια πρόβλεψη υψηλής ποιότητας, κατά κανόνα, πρέπει να χρησιμοποιήσετε σύνθετους αλγόριθμους μηχανικής εκμάθησης. Τέτοιοι αλγόριθμοι είναι δύσκολο να χρησιμοποιηθούν από μη ειδικούς.

Για να φτιάξετε εργαλεία πρόβλεψηςΠιο προσβάσιμοι, οι προγραμματιστές στο Ινστιτούτο Τεχνολογίας της Μασαχουσέτης (MIT) έχουν αναπτύξει ένα σύστημα που ενσωματώνει λειτουργίες πρόβλεψης πάνω από μια υπάρχουσα βάση δεδομένων χρονοσειρών. Η απλοποιημένη διεπαφή του συστήματος tspDB εκτελεί κάθε περίπλοκη μοντελοποίηση χωρίς παρέμβαση χρήστη.

Ο χρήστης του συστήματος χρειάζεται απλώς να πατήσει μερικάκλειδιά για να πάρετε μια πρόβλεψη. Ταυτόχρονα, ο υπολογισμός των μελλοντικών τιμών πραγματοποιείται κατά μέσο όρο σε 0,9 ms, σημειώνουν οι συγγραφείς. Για να λάβει μια απόφαση ένας απλός άνθρωπος, το σύστημα υπολογίζει επίσης διαστήματα εμπιστοσύνης, λαμβάνοντας υπόψη τον βαθμό αβεβαιότητας των προβλέψεων.

Ένας από τους λόγους για την επιτυχία του tspDB είναιχρησιμοποιώντας έναν νέο αλγόριθμο πρόβλεψης χρονοσειρών. Ο αλγόριθμός μας είναι ιδιαίτερα αποτελεσματικός κατά την ανάλυση πολυμεταβλητών χρονοσειρών, δηλαδή δεδομένων που περιέχουν περισσότερες από μία χρονικά εξαρτώμενες μεταβλητές. Για παράδειγμα, σε μια βάση δεδομένων καιρού, η θερμοκρασία, το σημείο δρόσου και η νέφωση εξαρτώνται από τις προηγούμενες τιμές τους.

Abdullah Alomar, μεταπτυχιακός φοιτητής στο Τμήμα Ηλεκτρολόγων Μηχανικών και Επιστήμης Υπολογιστών στο MIT, συν-συγγραφέας της ανάπτυξης

Ως βάση για τον αλγόριθμό σαςοι ερευνητές έκαναν Singular Spectrum Analysis (SSA). Χρησιμοποιώντας αυτή τη μέθοδο, μπορείτε να υπολογίσετε τιμές και να κάνετε προβλέψεις με βάση μεμονωμένες χρονοσειρές. Οι προγραμματιστές του MIT τροποποίησαν τον αλγόριθμο για να εξαλείψουν την ανάγκη χειροκίνητου ορισμού μεταβλητών.

Το δεύτερο και βασικό πρόβλημα, σύμφωνα μεπρογραμματιστές, επρόκειτο να προσαρμόσουν αυτή τη μέθοδο για την ανάλυση πολλαπλών χρονοσειρών. Η λύση που πρότειναν οι ερευνητές ήταν να «διπλώσουν» τους επιμέρους πίνακες χρονοσειρών σε έναν μεγαλύτερο πίνακα στον οποίο θα μπορούσε να εφαρμοστεί το SSA. Οι προγραμματιστές ονόμασαν τη μέθοδό τους mSSA. Οι επιστήμονες δημοσίευσαν στο παρελθόν μια λεπτομερή περιγραφή της έρευνας και του αλγόριθμου σε ένα άρθρο για το ArXiv.

Οι ερευνητές συνέκριναν το mSSA με άλλους προηγμένους αλγόριθμους, συμπεριλαμβανομένων μεθόδων βαθιάς μάθησης, σε σύνολα δεδομένων σε πραγματικό χρόνο που περιγράφουν δίκτυα ενέργειας, κίνηση και χρηματοοικονομικές αγορές.

Οι ερευνητές λένε τα αποτελέσματα των δοκιμώνέδειξαν ότι ο αλγόριθμός τους ξεπέρασε όλες τις εναλλακτικές στην ανάκτηση δεδομένων του παρελθόντος που λείπουν και όλες εκτός από μία εναλλακτική στην πρόβλεψη μελλοντικών τιμών. Οι προγραμματιστές έδειξαν επίσης την καθολική φύση του αλγορίθμου: μπορεί να εφαρμοστεί εξίσου αποτελεσματικά σε οποιαδήποτε χρονολογική σειρά.

Οι ερευνητές λένε ότι θα συνεχίσουν να βελτιώνουν το tspDB με νέους αλγόριθμους που θα βελτιώσουν περαιτέρω την ακρίβεια των προβλέψεων.

Μας ενδιαφέρει να κάνουμεΤο tspDB είναι ένα ευρέως χρησιμοποιούμενο σύστημα ανοιχτού κώδικα. Η ανάλυση χρονοσειρών είναι πολύ σημαντική και η ενσωμάτωση της συνάρτησης πρόβλεψης απευθείας στη βάση δεδομένων μας φαίνεται ο πιο βολικός τρόπος ανάλυσης. Αυτό δεν έχει ξαναγίνει και γι' αυτό θέλουμε να βεβαιωθούμε ότι ο κόσμος χρησιμοποιεί τη λύση μας.

Devavrat Shah, καθηγητής στο Τμήμα Ηλεκτρολόγων Μηχανικών και Επιστήμης Υπολογιστών στο MIT, συν-συγγραφέας της ανάπτυξης

Διαβάστε περισσότερα

Το «πέμπτο στοιχείο» υπάρχει: ένα νέο πείραμα θα επιβεβαιώσει ότι οι πληροφορίες είναι υλικές

Ανατριχιαστικοί ήχοι και μυστηριώδη πλάσματα: τα πιο περίεργα ευρήματα στην Τάφρο των Μαριανών

Δείτε την καλύτερη εικόνα του Ήλιου: αποτελείται από 83 εκατομμύρια pixel