날씨, 주가 등 시간에 따라 변하는 지표의 가치 예측
예측 도구를 만들려면보다 접근하기 쉬운 MIT(Massachusetts Institute of Technology)의 프로그래머는 기존 시계열 데이터베이스 위에 예측 기능을 통합하는 시스템을 개발했습니다. tspDB 시스템의 단순화된 인터페이스는 사용자 상호 작용 없이 모든 복잡한 모델링을 수행합니다.
시스템 사용자는 몇 번만 누르면 됩니다.예측을 얻기 위한 키. 동시에 미래 가치의 계산은 평균 0.9ms에서 수행된다고 저자는 지적합니다. 일반인이 결정을 내리기 위해 시스템은 예측의 불확실성 정도를 고려하여 신뢰 구간도 계산합니다.
tspDB의 성공 이유 중 하나는새로운 시계열 예측 알고리즘을 사용합니다. 우리의 알고리즘은 다변량 시계열, 즉 둘 이상의 시간 종속 변수를 포함하는 데이터를 분석할 때 특히 효과적입니다. 예를 들어, 날씨 데이터베이스에서 온도, 이슬점, 구름량은 과거 값에 따라 달라집니다.
Abdullah Alomar, MIT 전기 공학 및 컴퓨터 과학과 대학원생, 개발 공동 저자
알고리즘의 기초로연구원들은 SSA(Singular Spectrum Analysis)를 사용했습니다. 이 방법을 사용하면 값을 계산하고 개별 시계열을 기반으로 예측할 수 있습니다. MIT 프로그래머는 수동으로 변수를 설정할 필요가 없도록 알고리즘을 수정했습니다.
두 번째이자 핵심적인 문제는 다음과 같습니다.개발자들은 여러 시계열 분석을 위해 이 방법을 적용하기로 했습니다. 연구원들이 제안한 해결책은 개별 시계열 행렬을 SSA가 적용될 수 있는 하나의 더 큰 행렬로 "접는 것"이었습니다. 개발자들은 그들의 방법을 mSSA라고 불렀습니다. 과학자들은 이전에 ArXiv의 기사에서 연구 및 알고리즘에 대한 자세한 설명을 발표했습니다.
연구원들은 전력망, 도로 교통 및 금융 시장을 설명하는 실제 시간 데이터 세트에서 mSSA를 딥 러닝 방법을 포함한 다른 최첨단 알고리즘과 비교했습니다.
연구원들은 테스트 결과를 말합니다그들의 알고리즘이 누락된 과거 데이터를 복구하는 데 있어 모든 대안을 능가하고 미래 값을 예측하는 데 있어 하나를 제외한 모든 대안을 능가하는 것으로 나타났습니다. 개발자들은 또한 알고리즘의 보편적인 특성을 보여주었습니다. 즉, 모든 시계열에 동등하게 효과적으로 적용될 수 있습니다.
연구원들은 예측의 정확성을 더욱 향상시킬 새로운 알고리즘으로 tspDB를 계속 개선할 것이라고 말합니다.
우리는 하는 일에 관심이 있습니다tspDB는 널리 사용되는 오픈 소스 시스템입니다. 시계열 분석은 매우 중요하며 예측 기능을 데이터베이스에 직접 내장하는 것이 가장 편리한 분석 방법으로 보입니다. 이는 이전에 한 번도 수행된 적이 없기 때문에 우리는 전 세계가 우리 솔루션을 사용하도록 하고 싶습니다.
Devavrat Shah, MIT 전기 공학 및 컴퓨터 과학과 교수, 개발 공동 저자
더 읽어보기
"다섯 번째 요소" 존재: 새로운 실험을 통해 정보가 중요함을 확인할 수 있습니다.
소름 끼치는 소리와 신비한 생물: 마리아나 해구에서 가장 이상한 발견
최고의 태양 사진을 보세요. 8300만 픽셀로 구성되어 있습니다.