機器學習與應用 如果你能控制推理模型「思考」的時間會怎樣?CMU研究人員推出L1-1.5B:強化學習優化AI思考過程 by AI 台灣 2025-03-11 0 推理語言模型顯示出能透過生成更長的思考鏈... Read moreDetails
機器學習與應用 透過 CreditAI 在 Amazon Bedrock 轉型金融分析:Octus 與 AWS 的旅程 by AI 台灣 2025-03-11 0 投資專業人士面臨著處理大量數據以便及時做... Read moreDetails
機器學習與應用 這篇AI論文介紹了CODI:一個用於高效且可擴展的鏈式思考推理的自我蒸餾框架在大型語言模型中的應用 by AI 台灣 2025-03-10 0 鏈式思考提示(Chain-of-Thou... Read moreDetails
機器學習與應用 微軟與Ubiquant研究人員推出Logic-RL:一個基於規則的強化學習框架,通過在邏輯謎題上的訓練獲得類似R1的推理模式 by AI 台灣 2025-03-09 0 大型語言模型(LLMs)在後訓練階段取得... Read moreDetails
機器學習與應用 CMU 研究人員推出 PAPRIKA:一種微調方法,使語言模型能夠發展不受特定環境限制的通用決策能力 by AI 台灣 2025-03-08 0 在今天快速發展的人工智慧 (AI) 環境... Read moreDetails