OpenAI 正在推出一個更小、更有效率的人工智慧模型,名為 o3-mini,並且將免費提供給大家。這是因為他們想要回應最近來自中國人工智慧新創公司 DeepSeek 的新開源產品所引起的熱潮和興奮。
根據之前的報導,OpenAI 預計在 1 月 31 日推出這個新模型。據匿名消息來源透露,公司的研究人員一直在加班準備這個模型,以便能夠順利推出。
o3-mini 是 OpenAI 在 12 月時首次透露的,這是一個更小的模型,擁有目前 OpenAI 所有產品中最先進的人工智慧推理能力。這個模型可以將困難的問題拆解成更小的部分,以找出最佳的解決方法。
OpenAI 在一篇公告中表示:「這個強大且快速的模型推進了小型模型的可能性邊界。」
OpenAI 將 o3-mini 提供給所有 ChatGPT 的 Plus、Team 和 Pro 用戶。免費版本的 ChatGPT 用戶也可以試用 o3-mini,但他們發送的查詢次數會受到限制。
OpenAI 顯然已經使用博士生來幫助訓練這個新模型有一段時間了。幾週前,該公司開始招募博士計算機科學學生,每小時支付 100 美元,進行一項「研究合作」,這將「涉及未發布模型的工作」,根據 WIRED 查看的一封電子郵件內容。
OpenAI 似乎也在通過一家公司 Mercor 招募其他領域的博士生,這家公司經常被用來尋找模型訓練的工作人員。Mercor 最近在 LinkedIn 上的招聘廣告中表示:「您可能參與的這個項目的整體目標是創建挑戰性的科學編碼問題,旨在測試大型語言模型在生成解決現實科學研究問題的代碼能力。」
這則招聘廣告還舉了一個例子,這個問題與一個名為 SciCode 的基準測試中的問題非常相似,該測試旨在測試大型語言模型解決複雜科學問題的能力。
這個消息正值 DeepSeek 的 R1 模型在美國科技業引起了不小的震動。這樣一個強大的模型免費發布,對 Google 和 Anthropic 造成了壓力,迫使他們降低價格。
根據公司內部的消息來源,OpenAI 特別渴望展示它在人工智慧開發和商業化方面的領先地位。
DeepSeek 的免費模型包含了使其在訓練和服務上更有效率的創新。該公司似乎使用的資源遠少於 OpenAI 和其他美國公司目前在開發前沿人工智慧模型時所需的資源,儘管 DeepSeek 的具體支出細節仍不明確。OpenAI 表示,它相信 R1 可能在訓練中使用了其模型的輸出。
有消息嗎?
您是 OpenAI 的現任或前任員工嗎?我們想聽聽您的意見。請使用非工作電話或電腦,聯繫 Will Knight,電子郵件地址是 will_knight@wired.com,或通過他的 Signal 用戶名 wak01 聯繫。
OpenAI 最新的模型可能在價格上無法超越 R1,但它顯示出該公司將效率作為未來的重點。OpenAI 還表示,這個模型在數學、科學和編碼方面特別強大。
該公司表示,最新的模型還將加入新功能,包括能夠進行網路搜索、調用用戶代碼中的函數,以及在不同的推理層級之間切換,以在速度和解決問題的能力之間取得平衡。
DeepSeek 的突然崛起也引發了對美國政府如何應對中國在人工智慧領域崛起的策略的質疑。過去兩屆美國政府已經推出了一系列制裁措施,以限制中國獲取通常用於構建尖端人工智慧模型的最先進的 Nvidia 芯片。DeepSeek 在其研究中描述了幾種類型的 Nvidia 芯片,但具體使用了哪些仍不清楚。
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!