星期六, 19 7 月, 2025
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
No Result
View All Result
Your Ad
Home 機器學習與應用

大型視覺編碼器的多模態自回歸預訓練

2024-11-21
in 機器學習與應用
0 0
0
大型視覺編碼器的多模態自回歸預訓練
Share on FacebookShare on Twitter
Your Ad


*平等貢獻者

在大型多模態模型中,一個主導的範式是將一個大型語言解碼器與一個視覺編碼器配對。雖然已經知道如何為多模態任務預訓練和調整語言解碼器,但對於視覺編碼器應如何預訓練則不太清楚。一個事實上的標準是使用區分性目標(例如對比損失)來預訓練視覺編碼器。這導致了預訓練與生成自回歸下游任務之間的不匹配。同時,隨著它們在語言領域的成功,自回歸圖像模型已被證明能夠預訓練出強大且可擴展的視覺編碼器。本文介紹了AIMv2,一系列大型、強大的視覺編碼器,這些編碼器是使用多模態自回歸目標進行預訓練的。得益於一個能同時生成原始圖像片段和文本標記的多模態解碼器,我們的模型不僅在多模態任務中表現出色,還在本地化、基礎定位和分類等視覺識別基準上表現優異。此外,我們展示了AIMv2模型訓練效率高,並且在預訓練期間所需樣本數量顯著少於當前的最先進技術。

圖1:AIMv2 一覽

模型權重可在 HuggingFace 獲得。



Source link

Tags: 大型視覺編碼器的多模態自回歸預訓練
Previous Post

自動化與機器人技術有何不同?

Next Post

谷歌研究人員開發的 AlphaQubit:基於深度學習的量子計算錯誤檢測解碼器

Related Posts

劍橋大學和莫納什大學的研究人員推出 ReasonGraph:一個可視化和分析大型語言模型推理過程的網絡平台
機器學習與應用

劍橋大學和莫納什大學的研究人員推出 ReasonGraph:一個可視化和分析大型語言模型推理過程的網絡平台

2025-03-16
生成式人工智慧的影響及其對數據科學家的啟示
機器學習與應用

生成式人工智慧的影響及其對數據科學家的啟示

2025-03-15
這篇AI論文介紹了BD3-LMs:一種結合自回歸模型和擴散模型的混合方法,用於可擴展和高效的文本生成
機器學習與應用

這篇AI論文介紹了BD3-LMs:一種結合自回歸模型和擴散模型的混合方法,用於可擴展和高效的文本生成

2025-03-15
九個生鏽的Pico PIO瓦特(第二部分)
機器學習與應用

九個生鏽的Pico PIO瓦特(第二部分)

2025-03-15
開始使用 Amazon Bedrock Agents 的電腦操作
機器學習與應用

開始使用 Amazon Bedrock Agents 的電腦操作

2025-03-15
評估使用 Amazon Bedrock 知識庫的 RAG 應用程式
機器學習與應用

評估使用 Amazon Bedrock 知識庫的 RAG 應用程式

2025-03-14
Next Post
谷歌研究人員開發的 AlphaQubit:基於深度學習的量子計算錯誤檢測解碼器

谷歌研究人員開發的 AlphaQubit:基於深度學習的量子計算錯誤檢測解碼器

三個問題:Claire Wang 談記憶運動中的大腦訓練

三個問題:Claire Wang 談記憶運動中的大腦訓練

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Archives

  • 2025 年 6 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 10 月
  • 2023 年 9 月
  • 2023 年 8 月
  • 2023 年 7 月
  • 2023 年 5 月
  • 2023 年 3 月
  • 2023 年 1 月
  • 2022 年 12 月
  • 2022 年 11 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 1 月
  • 2021 年 11 月
  • 2021 年 8 月
  • 2021 年 5 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月
  • 2020 年 10 月
  • 2020 年 9 月
  • 2019 年 7 月
  • 2018 年 11 月

Categories

  • AI 智慧產業
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • 安全
  • 機器人與自動化
  • 機器學習與應用
  • 神經連結和腦機接口
  • 自然語言處理
  • 道德與法規
Your Ad
  • 關於我們
  • 廣告合作
  • 免責聲明
  • 隱私權政策
  • DMCA
  • Cookie 隱私權政策
  • 條款與條件
  • 聯絡我們
AI TAIWAN

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。