新型推理模型的介紹
這些模型在解決複雜問題方面非常有效。如果你正在解決一些博士級的數學問題,可以試試這些模型。或者,如果你之前的模型在回應你的高級提示時出現問題,這個新的推理模型可能會幫助你。要使用 o3-mini,只需在 ChatGPT 開始新提示時選擇「推理」。
運行成本的比較
雖然推理模型具備新的能力,但使用它們的成本也很高。OpenAI 的 o1-mini 運行成本是其非推理模型 GPT-4o mini 的 20 倍。該公司表示,新的模型 o3-mini 每個輸入標記的成本比 o1-mini 低 63%。不過,o3-mini 每百萬個輸入標記的價格是 1.10 美元,仍然是 GPT-4o mini 的七倍多。
DeepSeek 的新挑戰
這個新模型的推出正值 DeepSeek 發布新模型的時候,這個消息在人工智慧界引起了轟動。DeepSeek 的新模型表現與 OpenAI 的頂級模型一樣出色,但這家中國公司聲稱訓練成本約為 600 萬美元,而 OpenAI 的 GPT-4 訓練成本估計超過 1 億美元。(值得注意的是,很多人對這個說法提出質疑。)
成本與能耗的挑戰
此外,DeepSeek 的推理模型每百萬個輸入標記的成本是 0.55 美元,這是 o3-mini 價格的一半,因此 OpenAI 仍需努力降低成本。據估計,推理模型的能耗也比其他類型的模型高,因為它們需要進行更多的計算才能產生答案。
安全挑戰
這波新的推理模型也帶來了新的安全挑戰。OpenAI 使用了一種叫做深思熟慮對齊的技術來訓練其 o 系列模型,基本上是讓它們在推理的每一步中參考 OpenAI 的內部政策,以確保不忽略任何規則。
模型的風險評估
但該公司發現,o3-mini 和 o1 模型一樣,在越獄和「挑戰安全評估」方面顯著優於非推理模型。這意味著,由於其先進的能力,控制推理模型變得更加困難。o3-mini 是第一個在模型自主性上被評為「中等風險」的模型,這是因為它在特定的編碼任務上表現得比之前的模型更好,根據 OpenAI 的說法,這顯示出「更大的自我改進潛力和加速人工智慧研究」。不過,該模型在現實世界的研究方面仍然表現不佳。如果它在這方面更好,將會被評為高風險,OpenAI 也會限制該模型的發布。
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!