傳統模型與推理模型的差異
傳統模型和推理模型的差別,就像諾貝爾獎得主邁克爾·卡尼曼 (Michael Kahneman) 在他2011年的書《思考,快與慢》中描述的兩種思維方式:快速且直覺的系統一思維和較慢、更深思熟慮的系統二思維。
大型語言模型的運作
使ChatGPT成為可能的模型稱為大型語言模型 (LLM),它透過查詢一個龐大的神經網絡來即時產生對提示的回應。這些回應可能非常聰明且連貫,但在需要逐步推理的問題上,像是簡單的算術,可能會無法正確回答。
模仿推理的技巧
如果大型語言模型被指示制定一個計劃並遵循它,就可以強迫它模仿深思熟慮的推理。然而,這個技巧並不總是可靠,模型通常在解決需要廣泛、仔細計劃的問題時會遇到困難。OpenAI、Google和現在的Anthropic都在使用一種稱為強化學習的機器學習方法,讓他們最新的模型學會生成指向正確答案的推理。這需要從人類那裡收集額外的訓練數據,以解決特定問題。
Claude的推理模式
Penn表示,Claude的推理模式獲得了有關商業應用的額外數據,包括撰寫和修正程式碼、使用電腦以及回答複雜的法律問題。“我們改進的地方是……技術主題或需要長時間推理的主題,”Penn說。“我們從客戶那裡得到的反饋是,他們對將我們的模型應用到實際工作中非常感興趣。”
Claude 3.7的優勢
Anthropic表示,Claude 3.7在解決需要逐步推理的程式碼問題上特別出色,在一些基準測試中超過了OpenAI的o1。該公司今天推出了一個名為Claude Code的新工具,專門設計用於這種AI輔助的程式碼編寫。
複雜計劃的需求
“這個模型已經在編程方面表現良好,”Penn說。“但在需要非常複雜計劃的情況下,額外的思考會是有益的——比如你正在查看一個公司的極大程式碼庫。”
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!