1. OpenAI 的深度研究是什麼?你可以用它做什麼?
如果你有 OpenAI Plus 帳戶(每月 20 美元的計畫),你就可以使用深度研究。這讓你每個月可以進行 10 次查詢。如果你訂閱專業版(每月 200 美元),你可以更頻繁地使用深度研究,並且可以使用 GPT-4.5 的研究預覽,每月有 120 次查詢。
OpenAI 保證我們可以使用公共網路上的數據進行多步驟的研究。
所需時間:5 到 30 分鐘,視複雜程度而定。
以前,這類研究通常需要幾個小時。
這個功能適用於需要深入搜尋和徹底研究的複雜任務。
具體的使用案例是什麼樣的呢?
- 文獻回顧:進行有關機器學習和能源消耗的文獻回顧。
- 市場分析:根據當前市場趨勢和評估,創建 2025 年最佳行銷自動化平台的比較報告。
- 技術與軟體開發:調查 AI 應用開發的程式語言和框架,並進行性能和使用案例分析。
- 投資與金融分析:根據最近的報告和學術研究,研究 AI 驅動的交易對金融市場的影響。
- 法律研究:對比歐洲和美國的數據保護法,包括相關裁決和最近的變更。
2. 深度研究是如何運作的?
深度研究使用各種深度學習方法進行系統和詳細的信息分析。整個過程可以分為四個主要階段:
1. 分解和結構化研究問題
在第一步,工具使用自然語言處理(NLP)方法處理研究問題。它識別出最重要的關鍵詞、概念和子問題。
這一步確保 AI 不僅字面上理解問題,還能理解其內容。
2. 獲取相關信息
一旦工具結構化了研究問題,它就會專門搜尋信息。深度研究使用內部數據庫、科學出版物、API 和網頁抓取的混合。這些可以是開放存取的數據庫,例如 arXiv、PubMed 或 Semantic Scholar,也可以是公共網站或新聞網站,如《衛報》(The Guardian)、《紐約時報》(New York Times)或 BBC。最終,任何可以在線訪問且公開的內容都會被納入。
3. 數據分析與解釋
接下來,AI 模型會將大量文本總結成簡潔易懂的答案。變壓器和注意力機制確保最重要的信息被優先處理。這意味著它不會僅僅創建所有找到內容的摘要。此外,還會評估來源的質量和可信度,通常會使用交叉驗證方法來識別不正確或矛盾的信息。在這裡,AI 工具會將幾個來源進行比較。然而,具體的深度研究是如何做到這一點的,或有哪些標準,並不公開。
4. 生成最終報告
最後,生成最終報告並顯示給我們。這是通過自然語言生成(NLG)來完成的,以便我們看到易於閱讀的文本。
如果在提示中要求,AI 系統會生成圖表或表格,並根據用戶的風格調整回應。報告的最後也會列出主要使用的來源。
3. 如何使用深度研究:實際範例
在第一步,最好使用標準模型詢問如何優化提示,以便進行深度研究。我用以下提示在 ChatGPT 4o 中進行了這個操作:
“優化這個提示以進行深度研究:進行文獻搜索:進行有關機器學習和能源消耗的文獻搜索。”
4o 模型建議了以下提示用於深度研究功能:
然後工具問我是否可以澄清文獻回顧的範圍和重點。因此,我提供了一些額外的規範:

ChatGPT 然後返回澄清並開始研究。
在此期間,我可以看到進度,並且逐漸添加了更多來源。
6 分鐘後,最先進的文獻回顧完成了,報告以及所有來源都可以提供給我。
深度研究範例.mp4
4. 深度研究功能的挑戰和風險
讓我們來看看兩個研究的定義:
“對一個主題的詳細研究,特別是為了發現新信息或達到新的理解。”
參考:劍橋詞典
“研究是創造性和系統性的工作,旨在增加知識的儲備。它涉及收集、組織和分析證據,以增進對主題的理解,特徵是特別注意控制偏見和錯誤的來源。”
參考:維基百科研究
這兩個定義表明,研究是一個詳細的、系統的主題調查——目的是發現新信息或實現更深入的理解。
基本上,深度研究功能在某種程度上滿足了這些定義:它收集現有的信息,進行分析,並以結構化的方式呈現。
然而,我認為我們也需要意識到一些挑戰和風險:
- 表面化的危險:深度研究主要設計用來高效搜尋、總結並以結構化的形式提供現有信息(至少在當前階段)。這對於概覽研究非常好。但深入挖掘呢?真正的科學研究超越了單純的重複,並對來源進行批判性的檢視。科學也依賴於生成新知識。
- 強化研究與出版中的既有偏見:如果論文有顯著結果,則更有可能被發表。而“非顯著”或矛盾的結果則不太可能被發表。這就是我們所知道的出版偏見。如果 AI 工具主要評估經常被引用的論文,則會強化這一趨勢。稀有或不太廣泛但可能重要的發現會被忽略。一個可能的解決方案是實施一種加權來源評估機制,考慮到引用較少但相關的論文。如果 AI 方法主要引用經常被引用的來源,則可能會錯過不太廣泛但重要的發現。這種影響可能也適用於我們人類。
- 研究論文的質量:雖然顯然學士、碩士或博士論文不能僅基於 AI 生成的研究,但我想知道大學或科學機構如何應對這一發展。學生可以僅用一個提示就獲得一份扎實的研究報告。顯然,解決方案必須是調整評估標準,以更重視深入的反思和方法論。
最後的想法
除了 OpenAI,其他公司和平台也整合了類似的功能(甚至在 OpenAI 之前):例如,Perplexity AI 引入了一個深度研究功能,可以獨立進行和分析搜索。此外,谷歌的 Gemini 也整合了這樣的深度研究功能。
這個功能讓你對初步研究問題有了驚人的快速概覽。結果的可靠性仍有待觀察。目前(2025 年 3 月初),OpenAI 自身寫道,這個功能仍處於早期階段,有時會將事實幻覺化到答案中或得出錯誤的結論,並且難以區分權威信息和謠言。此外,它目前無法準確傳達不確定性。
但可以假設這個功能會進一步擴展,成為研究的強大工具。如果你有更簡單的問題,最好使用標準的 GPT-4o 模型(無論是否搜索),這樣你可以立即獲得答案。
你可以在哪裡繼續學習?
想要獲得更多有關科技、Python、數據科學、數據工程、機器學習和 AI 的技巧和建議嗎?那麼定期接收我在 Substack 上最受歡迎文章的摘要——精心策劃且免費。
點擊這裡訂閱我的 Substack!
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!