星期日, 15 6 月, 2025
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
No Result
View All Result
Your Ad
Home 機器學習與應用

KV 預測以改善首次標記的時間

2025-02-19
in 機器學習與應用
0 0
0
KV 預測以改善首次標記的時間
Share on FacebookShare on Twitter
Your Ad


使用變壓器語言模型的推理過程

使用變壓器(transformer)語言模型進行推理時,首先需要處理提示(prompt)。在這個步驟中,模型會生成第一個輸出標記,並儲存未來生成步驟所需的KV快取(KV cache)。這個提示處理的過程可能會很耗費計算資源,尤其是當提示的長度或批次大小增加時,對於擁有十億參數的模型,在邊緣設備上可能需要花費十幾秒甚至更長的時間。這會影響使用者的體驗,因為模型的輸出會有明顯的延遲。

為了減少生成預訓練模型的第一個輸出所需的時間(稱為“第一次標記時間”,或TTFT),我們提出了一種新方法,稱為KV預測(KV Prediction)。在這個方法中,我們使用一個小型輔助模型來處理提示,並生成基礎模型所需的KV快取的近似值。這個近似的KV快取隨後會與基礎模型一起使用,進行自回歸生成,而不需要再次查詢輔助模型。

我們的研究顯示,這種方法在效率和準確性之間達到了最佳的平衡,與基準相比,我們在TriviaQA上展示了15%到50%的相對準確性提升,這是在不同的TTFT FLOPs預算下的結果。我們還在固定的TTFT FLOPs預算下,展示了在HumanEval的Python代碼補全上,準確性提升高達30%。此外,我們在蘋果M2 Pro CPU(Apple M2 Pro CPU)上進行了基準測試,證明我們在FLOPs上的改進也轉化為硬體上的TTFT加速。我們在這裡釋出我們的代碼。



新聞來源

本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!

Tags: 預測以改善首次標記的時間
Previous Post

Elon Musk 的 DOGE 正在根據隱私法被起訴:需要了解的事項

Next Post

ViLa-MIL:透過雙尺度視覺-語言多實例學習提升全切片影像分類

Related Posts

劍橋大學和莫納什大學的研究人員推出 ReasonGraph:一個可視化和分析大型語言模型推理過程的網絡平台
機器學習與應用

劍橋大學和莫納什大學的研究人員推出 ReasonGraph:一個可視化和分析大型語言模型推理過程的網絡平台

2025-03-16
生成式人工智慧的影響及其對數據科學家的啟示
機器學習與應用

生成式人工智慧的影響及其對數據科學家的啟示

2025-03-15
這篇AI論文介紹了BD3-LMs:一種結合自回歸模型和擴散模型的混合方法,用於可擴展和高效的文本生成
機器學習與應用

這篇AI論文介紹了BD3-LMs:一種結合自回歸模型和擴散模型的混合方法,用於可擴展和高效的文本生成

2025-03-15
九個生鏽的Pico PIO瓦特(第二部分)
機器學習與應用

九個生鏽的Pico PIO瓦特(第二部分)

2025-03-15
開始使用 Amazon Bedrock Agents 的電腦操作
機器學習與應用

開始使用 Amazon Bedrock Agents 的電腦操作

2025-03-15
評估使用 Amazon Bedrock 知識庫的 RAG 應用程式
機器學習與應用

評估使用 Amazon Bedrock 知識庫的 RAG 應用程式

2025-03-14
Next Post
ViLa-MIL:透過雙尺度視覺-語言多實例學習提升全切片影像分類

ViLa-MIL:透過雙尺度視覺-語言多實例學習提升全切片影像分類

MIT 創業公司繪製身體的代謝物以揭示疾病的隱藏驅動因素 | MIT 新聞

MIT 創業公司繪製身體的代謝物以揭示疾病的隱藏驅動因素 | MIT 新聞

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Archives

  • 2025 年 6 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 10 月
  • 2023 年 9 月
  • 2023 年 8 月
  • 2023 年 7 月
  • 2023 年 5 月
  • 2023 年 3 月
  • 2023 年 1 月
  • 2022 年 12 月
  • 2022 年 11 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 1 月
  • 2021 年 11 月
  • 2021 年 8 月
  • 2021 年 5 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月
  • 2020 年 10 月
  • 2020 年 9 月
  • 2019 年 7 月
  • 2018 年 11 月

Categories

  • AI 智慧產業
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • 安全
  • 機器人與自動化
  • 機器學習與應用
  • 神經連結和腦機接口
  • 自然語言處理
  • 道德與法規
Your Ad
  • 關於我們
  • 廣告合作
  • 免責聲明
  • 隱私權政策
  • DMCA
  • Cookie 隱私權政策
  • 條款與條件
  • 聯絡我們
AI TAIWAN

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。