時間序列預測在金融、醫療和氣候科學等各個領域中扮演著重要角色。然而,準確預測仍然是一個重大挑戰。傳統方法如自回歸整合移動平均模型 (ARIMA) 和指數平滑法常常難以在不同領域之間進行泛化,或處理高維數據的複雜性。當代的深度學習方法雖然有潛力,但通常需要大量標記數據集和大量計算資源,這使得許多組織難以使用。此外,這些模型往往缺乏靈活性,無法處理不同的時間粒度和預測範圍,進一步限制了它們的應用。
谷歌人工智慧 (Google AI) 最近推出了 TimesFM-2.0,這是一個新的時間序列預測基礎模型,現在可以在 Hugging Face 上以 JAX 和 PyTorch 的實現版本獲得。這次發布提高了準確性,並擴展了最大上下文長度,為預測挑戰提供了一個強大且多功能的解決方案。TimesFM-2.0 在前一版本的基礎上進行了架構改進,並利用了多樣的訓練語料,確保在各種數據集上表現出色。
該模型在 Hugging Face 上的開放可用性強調了谷歌人工智慧支持人工智慧社群合作的努力。研究人員和開發者可以輕鬆地微調或部署 TimesFM-2.0,促進時間序列預測實踐的進步。
技術創新與好處
TimesFM-2.0 包含幾項提升其預測能力的進步。它的解碼器架構設計能夠適應不同的歷史長度、預測範圍和時間粒度。像是輸入補丁和補丁遮罩的技術使得訓練和推斷更有效,同時也支持零樣本預測,這在預測模型中是相當罕見的特性。
其一個關鍵特性是能夠通過生成更大的輸出補丁來預測更長的範圍,減少自回歸解碼的計算負擔。該模型在一個豐富的數據集上進行訓練,這些數據來自 Google 趨勢 (Google Trends) 和維基媒體 (Wikimedia) 的頁面瀏覽量等真實世界數據,以及合成數據集。這種多樣的訓練數據使得模型能夠識別廣泛的時間模式。預訓練超過 1000 億個時間點,使 TimesFM-2.0 的表現可與最先進的監督模型相媲美,通常不需要特定任務的微調。
該模型擁有 2 億個參數,平衡了計算效率和預測準確性,使其在各種場景中都能實用。
結果與見解
實證評估強調了該模型的強大表現。在零樣本設定中,TimesFM-2.0 在各種數據集上始終表現良好,與傳統和深度學習基準相比。例如,在 Monash 存檔——一個涵蓋各種粒度和領域的 30 個數據集的集合中——TimesFM-2.0 在縮放的平均絕對誤差 (MAE) 方面取得了優越的結果,超越了 N-BEATS 和 DeepAR 等模型。
在 Darts 基準測試中,包括具有複雜季節模式的單變量數據集,TimesFM-2.0 也提供了競爭力的結果,經常與表現最佳的方法相匹配。同樣,在 Informer 數據集的評估中,例如電力變壓器溫度數據集,顯示了該模型在處理長期預測(例如 96 和 192 步)的有效性。
TimesFM-2.0 在點預測和概率預測準確性指標上位居 GIFT-Eval 排行榜首位。
消融研究強調了特定設計選擇的影響。例如,增加輸出補丁的長度減少了自回歸步驟的數量,提高了效率而不犧牲準確性。合成數據的納入在解決代表性不足的粒度(如季度和年度數據集)方面證明了其價值,進一步增強了模型的穩健性。
結論
谷歌人工智慧推出的 TimesFM-2.0 代表了時間序列預測的一次深思熟慮的進步。通過結合可擴展性、準確性和適應性,該模型為常見的預測挑戰提供了一個實用且高效的解決方案。其開源可用性邀請研究社群探索其潛力,促進該領域的進一步創新。無論是用於金融建模、氣候預測還是醫療分析,TimesFM-2.0 都能幫助組織自信且精確地做出明智的決策。
請查看 Hugging Face 上的論文和模型。這項研究的所有功勞都歸於該項目的研究人員。此外,別忘了在 Twitter 上關注我們,加入我們的 Telegram 頻道和 LinkedIn 群組。還有,別忘了加入我們的 60k+ 機器學習 SubReddit。
🚨 免費即將舉行的人工智慧網路研討會 (2025年1月15日):使用合成數據和評估智慧提升 LLM 準確性——參加這個網路研討會,獲取提升 LLM 模型性能和準確性的可行見解,同時保護數據隱私。
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!