MIT פיתחה אלגוריתם אוניברסלי לחיזוי העתיד

חיזוי ערכי אינדיקטורים המשתנים עם הזמן, כגון מזג אוויר, מחירי מניות

או הסיכון לפתח מחלה, מתבצע עלמבוסס על ניתוח נתונים היסטורי. כדי לבנות תחזית באיכות גבוהה, ככלל, אתה צריך להשתמש באלגוריתמים מורכבים של למידת מכונה. אלגוריתמים כאלה קשים לשימוש ללא מומחים.

לעשות כלי חיזוינגיש יותר, מתכנתים במכון הטכנולוגי של מסצ'וסטס (MIT) פיתחו מערכת המשלבת פונקציות חיזוי על גבי מסד נתונים קיים של סדרות זמן. הממשק הפשוט של מערכת tspDB מבצע את כל המודלים המורכבים ללא אינטראקציה של המשתמש.

המשתמש במערכת רק צריך ללחוץ על כמהמפתחות כדי לקבל תחזית. במקביל, חישוב הערכים העתידיים מתבצע בממוצע ב-0.9 אלפיות השנייה, מציינים המחברים. על מנת שהדיוט יקבל החלטה, המערכת מחשבת גם רווחי סמך תוך התחשבות במידת אי הוודאות של התחזית.

אחת הסיבות להצלחה של tspDB היאבאמצעות אלגוריתם חדש לחיזוי סדרות זמן. האלגוריתם שלנו יעיל במיוחד כאשר מנתחים סדרות זמן רב משתנים, כלומר נתונים המכילים יותר ממשתנה תלוי זמן אחד. לדוגמה, במסד נתונים של מזג אוויר, הטמפרטורה, נקודת הטל וכיסוי העננים תלויים בערכי העבר שלהם.

עבדאללה אלומר, סטודנט לתואר שני במחלקה להנדסת חשמל ומדעי המחשב ב-MIT, מחבר שותף לפיתוח

כבסיס לאלגוריתם שלךהחוקרים לקחו ניתוח ספקטרום יחיד (SSA). באמצעות שיטה זו, אתה יכול לחשב ערכים ולבצע תחזיות על סמך סדרות זמן בודדות. מתכנתי MIT שינו את האלגוריתם כדי למנוע את הצורך בהגדרה ידנית של משתנים.

הבעיה השנייה והמפתח, לפימפתחים, היה להתאים שיטה זו לניתוח של סדרות זמן מרובות. הפתרון שהציעו החוקרים היה "לקפל" את מטריצות סדרות הזמן הבודדות למטריצה ​​אחת גדולה יותר עליה ניתן היה להחיל SSA. המפתחים קראו לשיטה שלהם mSSA. מדענים פרסמו בעבר תיאור מפורט של המחקר והאלגוריתם במאמר על ArXiv.

החוקרים השוו את mSSA עם אלגוריתמים חדישים אחרים, כולל שיטות למידה עמוקה, על מערכי נתונים זמניים אמיתיים המתארים רשתות חשמל, תעבורה ושווקים פיננסיים.

חוקרים טוענים שתוצאות הבדיקההראו שהאלגוריתם שלהם עלה על כל האלטרנטיבות בשחזור נתוני העבר החסרים וכולם מלבד חלופה אחת בחיזוי ערכים עתידיים. המפתחים גם הראו את האופי האוניברסלי של האלגוריתם: ניתן ליישם אותו ביעילות באותה מידה על כל סדרת זמן.

החוקרים אומרים שהם ימשיכו לשפר את tspDB עם אלגוריתמים חדשים שישפרו עוד יותר את הדיוק של התחזיות.

אנחנו מעוניינים לעשותtspDB היא מערכת קוד פתוח בשימוש נרחב. ניתוח סדרות זמן חשוב מאוד, והטמעת פונקציית החיזוי ישירות במסד הנתונים נראית לנו הדרך הנוחה ביותר לניתוח. זה מעולם לא נעשה בעבר ולכן אנחנו רוצים לוודא שהעולם משתמש בפתרון שלנו.

Devavrat Shah, פרופסור במחלקה להנדסת חשמל ומדעי המחשב ב-MIT, מחבר שותף לפיתוח

קרא עוד

"האלמנט החמישי" קיים: ניסוי חדש יאשר שהמידע הוא מהותי

צלילים מצמררים ויצורים מסתוריים: הממצאים המוזרים ביותר בתעלת מריאנה

תראו את התמונה הטובה ביותר של השמש: היא מורכבת מ-83 מיליון פיקסלים