OpenAI 免費發布其新的 o3-mini 推理模型

新型推理模型的介紹

這些模型在解決複雜問題方面非常有效。如果你正在解決一些博士級的數學問題，可以試試這些模型。或者，如果你之前的模型在回應你的高級提示時出現問題，這個新的推理模型可能會幫助你。要使用 o3-mini，只需在 ChatGPT 開始新提示時選擇「推理」。

運行成本的比較

雖然推理模型具備新的能力，但使用它們的成本也很高。OpenAI 的 o1-mini 運行成本是其非推理模型 GPT-4o mini 的 20 倍。該公司表示，新的模型 o3-mini 每個輸入標記的成本比 o1-mini 低 63%。不過，o3-mini 每百萬個輸入標記的價格是 1.10 美元，仍然是 GPT-4o mini 的七倍多。

DeepSeek 的新挑戰

這個新模型的推出正值 DeepSeek 發布新模型的時候，這個消息在人工智慧界引起了轟動。DeepSeek 的新模型表現與 OpenAI 的頂級模型一樣出色，但這家中國公司聲稱訓練成本約為 600 萬美元，而 OpenAI 的 GPT-4 訓練成本估計超過 1 億美元。（值得注意的是，很多人對這個說法提出質疑。）

成本與能耗的挑戰

此外，DeepSeek 的推理模型每百萬個輸入標記的成本是 0.55 美元，這是 o3-mini 價格的一半，因此 OpenAI 仍需努力降低成本。據估計，推理模型的能耗也比其他類型的模型高，因為它們需要進行更多的計算才能產生答案。

安全挑戰

這波新的推理模型也帶來了新的安全挑戰。OpenAI 使用了一種叫做深思熟慮對齊的技術來訓練其 o 系列模型，基本上是讓它們在推理的每一步中參考 OpenAI 的內部政策，以確保不忽略任何規則。

模型的風險評估

但該公司發現，o3-mini 和 o1 模型一樣，在越獄和「挑戰安全評估」方面顯著優於非推理模型。這意味著，由於其先進的能力，控制推理模型變得更加困難。o3-mini 是第一個在模型自主性上被評為「中等風險」的模型，這是因為它在特定的編碼任務上表現得比之前的模型更好，根據 OpenAI 的說法，這顯示出「更大的自我改進潛力和加速人工智慧研究」。不過，該模型在現實世界的研究方面仍然表現不佳。如果它在這方面更好，將會被評為高風險，OpenAI 也會限制該模型的發布。

新聞來源

本文由 AI 台灣 運用 AI 技術編撰，內容僅供參考，請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團，
隨時掌握最新 AI 動態與實用資訊！