星期三, 14 5 月, 2025
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
No Result
View All Result
Your Ad
Home 自然語言處理

揭示捷徑:檢索增強生成(RAG)如何影響語言模型行為和記憶利用

2024-06-20
in 自然語言處理
0 0
0
揭示捷徑:檢索增強生成(RAG)如何影響語言模型行為和記憶利用
Share on FacebookShare on Twitter
Your Ad


來自微軟 (Microsoft)、麻薩諸塞大學阿默斯特分校 (University of Massachusetts, Amherst) 和馬里蘭大學 (University of Maryland, College Park) 的研究人員,正在研究檢索增強生成 (Retrieval Augmented Generation, RAG) 如何影響語言模型 (Language Models, LMs) 的推理和事實準確性。這項研究的重點是語言模型在回答事實問題時,是否更依賴 RAG 提供的外部上下文,而不是它們的內部記憶。

目前提高語言模型事實準確性的方法,通常涉及增強模型的內部參數或使用外部檢索系統,在推理過程中提供額外的上下文。像 ROME 和 MEMIT 的技術,專注於編輯模型的內部參數來更新知識。然而,對於這些模型如何平衡使用內部(參數)知識和外部(非參數)上下文在 RAG 中的情況,研究仍然有限。

研究人員提出了一種機械性檢查 RAG 流程的方法,以確定語言模型在回答事實問題時,依賴外部上下文與內部記憶的程度。他們使用兩個先進的語言模型,LLaMa-2 和 Phi-2,進行分析,並採用因果中介分析 (Causal Mediation Analysis)、注意力貢獻 (Attention Contributions) 和注意力剔除 (Attention Knockouts) 等方法。

研究人員利用三種關鍵技術來管理 RAG 下語言模型的內部運作:

1. 因果追蹤 (Causal tracing) 確定模型中哪些隱藏狀態對事實預測至關重要。通過比較一個被破壞的運行(故意改變部分輸入)與一個正常運行和一個恢復運行(將正常激活重新引入被破壞的運行),研究人員測量間接效應 (Indirect Effect, IE),以確定特定隱藏狀態的重要性。

2. 注意力貢獻 (Attention contributions) 研究主題標記與輸出中最後一個標記之間的注意力權重。這有助於分析每個標記獲得多少注意力,以了解模型是否更依賴 RAG 提供的外部上下文或其內部知識。

3. 注意力剔除 (Attention knockouts) 涉及將關鍵注意力權重設置為負無限大,以阻止特定標記之間的信息流。通過觀察當這些注意力權重被剔除時預測質量的下降,研究人員可以識別哪些連接對準確預測至關重要。

結果顯示,在 RAG 上下文的影響下,LLaMa-2 和 Phi-2 模型對其內部參數記憶的依賴顯著減少。當 RAG 上下文存在時,查詢中主題標記的平均間接效應顯著降低。此外,最後一個標記的殘餘流從上下文中的屬性標記獲得了更多豐富的信息,而不是來自查詢中的主題標記。注意力貢獻和剔除進一步確認了模型在事實預測中更重視外部上下文,而非內部記憶。然而,這種方法的具體運作方式尚不清楚。

總結來說,這項研究表明,語言模型在回答事實問題時,表現出一種「捷徑」行為,重度依賴 RAG 提供的外部上下文,而非其內部參數記憶。通過機械性分析語言模型如何處理和優先考慮信息,研究人員提供了對參數和非參數知識在檢索增強生成中的相互作用的寶貴見解。這項研究強調了理解這些動態的重要性,以提高模型在實際應用中的表現和可靠性。

查看論文。這項研究的所有功勞都歸於這個項目的研究人員。此外,別忘了在 Twitter 上關注我們。

加入我們的 Telegram 頻道和 LinkedIn 群組。

如果你喜歡我們的工作,你會喜歡我們的電子報。

別忘了加入我們的 44k+ 機器學習 SubReddit。



新聞來源

本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!

Tags: 揭示捷徑檢索增強生成RAG如何影響語言模型行為和記憶利用
Previous Post

顯微鏡系統提升科學家對神經迴路連結的觀察 | 麻省理工學院新聞

Next Post

工廠人工智慧推出「程式機器人」,旨在自動化和增強編碼,具備先進的自主能力:在SWE-bench Full上達到19.27%,在SWE-bench Lite上達到31.67%

Related Posts

OpenAI 正在開發代理人 — 每週 AI 通訊 (2025 年 3 月 17 日)
自然語言處理

OpenAI 正在開發代理人 — 每週 AI 通訊 (2025 年 3 月 17 日)

2025-03-17
什麼是自然語言語義學?
自然語言處理

什麼是自然語言語義學?

2025-03-13
阿拉伯方言的詞彙距離研究:全面概述
自然語言處理

阿拉伯方言的詞彙距離研究:全面概述

2025-03-12
阿里巴巴發布 QwQ-32B 並附上理由 — 每週 AI 通訊 (2025 年 3 月 10 日)
自然語言處理

阿里巴巴發布 QwQ-32B 並附上理由 — 每週 AI 通訊 (2025 年 3 月 10 日)

2025-03-10
GPT 4.5 發佈! — 每週 AI 通訊 (2025 年 3 月 3 日)
自然語言處理

GPT 4.5 發佈! — 每週 AI 通訊 (2025 年 3 月 3 日)

2025-03-03
自然語言處理的主要關鍵領域
自然語言處理

自然語言處理的主要關鍵領域

2025-03-03
Next Post
工廠人工智慧推出「程式機器人」,旨在自動化和增強編碼,具備先進的自主能力:在SWE-bench Full上達到19.27%,在SWE-bench Lite上達到31.67%

工廠人工智慧推出「程式機器人」,旨在自動化和增強編碼,具備先進的自主能力:在SWE-bench Full上達到19.27%,在SWE-bench Lite上達到31.67%

神經系統驅動的義肢幫助截肢者自然行走 | 麻省理工學院新聞

神經系統驅動的義肢幫助截肢者自然行走 | 麻省理工學院新聞

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Archives

  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 10 月
  • 2023 年 9 月
  • 2023 年 8 月
  • 2023 年 7 月
  • 2023 年 5 月
  • 2023 年 3 月
  • 2023 年 1 月
  • 2022 年 12 月
  • 2022 年 11 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 1 月
  • 2021 年 11 月
  • 2021 年 8 月
  • 2021 年 5 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月
  • 2020 年 10 月
  • 2020 年 9 月
  • 2019 年 7 月
  • 2018 年 11 月

Categories

  • AI 智慧產業
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • 安全
  • 機器人與自動化
  • 機器學習與應用
  • 神經連結和腦機接口
  • 自然語言處理
  • 道德與法規
Your Ad
  • 關於我們
  • 廣告合作
  • 免責聲明
  • 隱私權政策
  • DMCA
  • Cookie 隱私權政策
  • 條款與條件
  • 聯絡我們
AI TAIWAN

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。