星期三, 14 5 月, 2025
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
No Result
View All Result
Your Ad
Home 機器學習與應用

多麼容易欺騙你的多模態大型語言模型?對欺騙提示的實證分析

2024-12-05
in 機器學習與應用
0 0
0
多麼容易欺騙你的多模態大型語言模型?對欺騙提示的實證分析
Share on FacebookShare on Twitter
Your Ad


多模態大型語言模型的挑戰

多模態大型語言模型 (MLLMs) 的進步非常驚人,但它們在處理不實資訊時仍然面臨挑戰。這些模型在接收到誤導性提示時,可能會產生錯誤的回答。我們為了量化這種脆弱性,推出了 MAD-Bench,一個精心設計的基準測試,裡面有 1000 個測試樣本,分成五個類別,例如不存在的物體、物體的數量和空間關係。

我們的研究

我們對一些流行的 MLLMs 進行了全面分析,包括 GPT-4v、Reka、Gemini-Pro,以及一些開源模型,如 LLaVA-NeXT 和 MiniCPM-Llama3。實驗中,我們發現 GPT-4o 和其他模型之間的表現差距很大;而以前經過強化指令調整的模型在這個新基準上效果不佳。GPT-4o 在 MAD-Bench 上的準確率達到 82.82%,但其他模型的準確率僅在 9% 到 50% 之間。

改進的方法

我們還提出了一個解決方案,就是在誤導性提示中添加一段額外的文字,鼓勵模型在回答問題之前再思考一下。令人驚訝的是,這個簡單的方法甚至可以將準確率提高一倍;不過,這些絕對數字仍然太低,無法令人滿意。我們希望 MAD-Bench 能成為一個有價值的基準,促進進一步的研究,以增強模型對誤導性提示的抵抗力。



新聞來源

本文由 AI 台灣 使用 AI 編撰,內容僅供參考,請自行進行事實查核。加入 AI TAIWAN Google News,隨時掌握最新 AI 資訊!

Tags: 多麼容易欺騙你的多模態大型語言模型對欺騙提示的實證分析
Previous Post

紅木軟體的全球支持賦能用戶

Next Post

谷歌深度思維推出 Genie 2:一個自回歸潛在擴散模型,用於虛擬世界和遊戲創作,僅需最少輸入

Related Posts

劍橋大學和莫納什大學的研究人員推出 ReasonGraph:一個可視化和分析大型語言模型推理過程的網絡平台
機器學習與應用

劍橋大學和莫納什大學的研究人員推出 ReasonGraph:一個可視化和分析大型語言模型推理過程的網絡平台

2025-03-16
生成式人工智慧的影響及其對數據科學家的啟示
機器學習與應用

生成式人工智慧的影響及其對數據科學家的啟示

2025-03-15
這篇AI論文介紹了BD3-LMs:一種結合自回歸模型和擴散模型的混合方法,用於可擴展和高效的文本生成
機器學習與應用

這篇AI論文介紹了BD3-LMs:一種結合自回歸模型和擴散模型的混合方法,用於可擴展和高效的文本生成

2025-03-15
九個生鏽的Pico PIO瓦特(第二部分)
機器學習與應用

九個生鏽的Pico PIO瓦特(第二部分)

2025-03-15
開始使用 Amazon Bedrock Agents 的電腦操作
機器學習與應用

開始使用 Amazon Bedrock Agents 的電腦操作

2025-03-15
評估使用 Amazon Bedrock 知識庫的 RAG 應用程式
機器學習與應用

評估使用 Amazon Bedrock 知識庫的 RAG 應用程式

2025-03-14
Next Post
谷歌深度思維推出 Genie 2:一個自回歸潛在擴散模型,用於虛擬世界和遊戲創作,僅需最少輸入

谷歌深度思維推出 Genie 2:一個自回歸潛在擴散模型,用於虛擬世界和遊戲創作,僅需最少輸入

如何建立通用 LLM 代理 | Maya Murad 著 | 2024 年 12 月

如何建立通用 LLM 代理 | Maya Murad 著 | 2024 年 12 月

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Archives

  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 10 月
  • 2023 年 9 月
  • 2023 年 8 月
  • 2023 年 7 月
  • 2023 年 5 月
  • 2023 年 3 月
  • 2023 年 1 月
  • 2022 年 12 月
  • 2022 年 11 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 1 月
  • 2021 年 11 月
  • 2021 年 8 月
  • 2021 年 5 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月
  • 2020 年 10 月
  • 2020 年 9 月
  • 2019 年 7 月
  • 2018 年 11 月

Categories

  • AI 智慧產業
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • 安全
  • 機器人與自動化
  • 機器學習與應用
  • 神經連結和腦機接口
  • 自然語言處理
  • 道德與法規
Your Ad
  • 關於我們
  • 廣告合作
  • 免責聲明
  • 隱私權政策
  • DMCA
  • Cookie 隱私權政策
  • 條款與條件
  • 聯絡我們
AI TAIWAN

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。