NuminaMath 1.5：NuminaMath 第二次迭代，推進具備增強競賽級數據集、驗證過的元數據和改進推理能力的 AI 驅動數學問題解決方案

數學推理仍然是人工智慧（AI）面臨的最複雜挑戰之一。雖然AI在自然語言處理（NLP）和模式識別方面取得了進展，但它用類似人類的邏輯和推理來解決複雜數學問題的能力仍然落後。許多AI模型在結構化問題解決、符號推理以及理解數學概念之間的深層關係方面都面臨困難。要解決這一差距，需要高品質、結構化的數據集，讓AI能夠從專家的數學推理中學習，提高問題解決的準確性。

為了滿足上述需求，Project-Numina推出了NuminaMath 1.5，這是其進階AI訓練數據集NuminaMath的第二版，專門針對數學推理進行設計。NuminaMath 1.5在前一版本的基礎上，提供了大約900,000個競賽級數學問題的精選集合。這些問題使用了思維鏈（CoT）方法，確保AI模型遵循邏輯的逐步推理過程來得出解答。數據集中的問題來自中國高中數學、美國數學競賽和國際奧林匹克，提供了廣泛的難度級別，以有效地訓練AI系統。

NuminaMath 1.5的主要創新在於其豐富的問題元數據，包括：

文字問題的最終答案。

數學領域包括代數、幾何、數論和微積分。

問題類型分為多選題（MCQs）、證明題和文字題。

這些改進使NuminaMath 1.5成為一個更結構化和可驗證的AI訓練資源。它們在面對未見的數學挑戰時，能夠提供更好的泛化和推理能力。

Project-Numina採用了手動驗證的方法，對來自奧林匹克數據集的問題進行檢查，以確保數據集的準確性和可靠性。之前版本的NuminaMath因自動提取技術而遇到解析問題，有時錯誤解讀問題結構。因此，NuminaMath 1.5現在利用來自國家奧林匹克網站的官方來源，確保每個問題和解答都被準確地轉錄和格式化。

最新的數據集包括在關鍵數學領域中手動策劃的問題，例如：

中國數學競賽（cn_contest）

由專家數學家驗證的不等式和數論

這種對策劃和驗證數據的重視，確保AI模型能從真實、高品質的來源中學習。

NuminaMath 1.5的另一個重大改進是去除了合成數據集，例如synthetic_amc。雖然之前的版本包含合成問題以擴大數據集的多樣性，但研究發現合成數據在問題結構上引入了不一致，輕微影響了AI的表現。因此，NuminaMath 1.5刪除了合成問題，確保AI模型僅接觸真實的競賽級數學，而不是人工生成的內容。

NuminaMath 1.5提供來自多個來源的問題，確保數學挑戰的多樣性。數據集包括：

奧林匹克問題：來自國內和國際數學奧林匹克的驗證問題。

AOPS論壇數據：來自數學討論論壇，包含一般問題和競賽風格問題的混合。

AMC和AIME問題：來自美國數學競賽（AMC）和美國邀請數學考試（AIME）的問題。

中國K-12數學：來自中國高中課程的大量問題，提供代數和幾何的堅實基礎。

總結來說，NuminaMath 1.5提供了896,215個來自奧林匹克、國家競賽和學術論壇的驗證競賽級數學問題。結構化的元數據，包括問題類型、問題格式和驗證解答，確保了精確的分類和分析。該數據集去除了合成問題，專注於手動策劃的高品質數據。這是一個對研究和AI訓練至關重要的資源，涵蓋了268,000多個K-12問題、73,000個來自論壇的問題，以及精英競賽集。

查看數據集。所有研究的功勞都歸於這個項目的研究人員。此外，別忘了在Twitter上關注我們，加入我們的Telegram頻道和LinkedIn小組。還有，記得加入我們的75k+ ML SubReddit。

🚨 推薦的開源AI平台：‘IntellAgent是一個開源的多代理框架，用於評估複雜的對話AI系統’（推廣）

新聞來源

本文由 AI 台灣 運用 AI 技術編撰，內容僅供參考，請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團，
隨時掌握最新 AI 動態與實用資訊！