星期三, 14 5 月, 2025
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
No Result
View All Result
Your Ad
Home AI 綜合新聞

這篇AI論文介紹了SRDF:一個自我精煉的數據飛輪,用於高品質的視覺與語言導航數據集

2024-12-16
in AI 綜合新聞
0 0
0
這篇AI論文介紹了SRDF:一個自我精煉的數據飛輪,用於高品質的視覺與語言導航數據集
Share on FacebookShare on Twitter
Your Ad


視覺與語言導航 (Vision-and-Language Navigation, VLN) 是一種結合視覺感知和自然語言理解的技術,目的是引導機器人在三維環境中導航。這項技術的目標是讓機器能夠像人類一樣,根據指示在複雜的空間中有效移動。這些進步在機器人技術、擴增實境和智慧助手技術中具有潛力,因為語言指示可以引導與實體空間的互動。

在 VLN 研究中,核心問題是缺乏高品質的標註數據集,這些數據集需要將導航路徑與精確的自然語言指示配對。手動標註這些數據集需要大量的資源、專業知識和努力,使得這個過程既昂貴又耗時。此外,這些標註通常無法提供足夠的語言豐富性和準確性,限制了模型在不同環境中的有效性,影響其在現實應用中的表現。

現有的解決方案依賴於合成數據生成和環境增強。合成數據是通過路徑到指示模型生成的,而模擬器則用來多樣化環境。然而,這些方法的質量往往不足,導致語言和導航路徑之間的數據對齊不良。這種不對齊會導致機器的表現不佳。問題還因為評估指示的語意和方向與其對應路徑的對齊度的指標不足而變得更加複雜,這使得質量控制變得困難。

來自上海人工智慧實驗室、北卡羅來納大學教堂山分校、Adobe 研究和南京大學的研究人員提出了一種名為自我精煉數據飛輪 (Self-Refining Data Flywheel, SRDF) 的系統,旨在通過指示生成器和導航器之間的相互合作,迭代地改善數據集和模型。這種完全自動化的方法消除了人為標註的需求。SRDF 系統從一個小型的高品質人類標註數據集開始,生成合成指示並用於訓練基礎導航器。導航器然後評估這些指示的準確性,過濾掉低品質數據,以便在後續迭代中訓練更好的生成器。這種迭代精煉確保了數據質量和模型性能的持續改進。

SRDF 系統由兩個主要組件組成:指示生成器和導航器。生成器使用先進的多模態語言模型從路徑創建合成導航指示。導航器則通過測量其跟隨生成路徑的準確性來評估這些指示。根據嚴格的準確性指標來識別高品質數據,例如成功率加權路徑長度 (Success weighted by Path Length, SPL) 和標準化動態時間扭曲 (normalized Dynamic Time Warping, nDTW)。低品質數據要麼重新生成,要麼排除,確保僅使用可靠且高度對齊的數據進行訓練。經過三次迭代,系統精煉出包含 2000 萬個高準確性指示-路徑對的數據集,涵蓋 860 種不同的環境。

SRDF 系統在各種指標和基準測試中顯示出卓越的性能提升。在房間到房間 (Room-to-Room, R2R) 數據集中,導航器的 SPL 指標從 70% 上升到前所未有的 78%,超過了人類基準的 76%。這是 VLN 代理首次超越人類水平的導航準確性。指示生成器也取得了令人印象深刻的結果,SPICE 分數從 23.5 增加到 26.2,超越了所有先前的視覺與語言導航指示生成方法。此外,SRDF 生成的數據促進了下游任務的優越泛化,包括長期導航 (R4R) 和基於對話的導航 (CVDN),在所有測試的數據集中都達到了最先進的性能。

具體來說,該系統在長距離導航方面表現出色,在 R4R 數據集上成功率提高了 16.6%。CVDN 數據集在目標進度指標上顯著提升,超越了所有先前的模型。此外,SRDF 的可擴展性明顯,指示生成器在更大的數據集和多樣化的環境中持續改進,確保在不同任務和基準測試中穩健的表現。研究人員還報告了指示的多樣性和豐富性有所增強,SRDF 生成的數據集中納入了超過 10,000 個獨特單詞,解決了先前數據集的詞彙限制。

SRDF 方法通過自動化數據集的精煉,解決了 VLN 中長期存在的數據稀缺挑戰。導航器和指示生成器之間的迭代合作確保了兩個組件的持續增強,最終導致高度對齊的高品質數據集。這一突破性方法在 VLN 研究中樹立了新的標準,展示了數據質量和對齊在推進具身人工智慧中的關鍵角色。SRDF 能夠超越人類表現並在多樣化任務中進行泛化,預示著在開發智能導航系統方面將推動重大進展。

查看論文和 GitHub 頁面。這項研究的所有功勞都歸於這個項目的研究人員。另外,別忘了在 Twitter 上關注我們,加入我們的 Telegram 頻道和 LinkedIn 群組。還有,別忘了加入我們的 60,000 多名機器學習 SubReddit。

🚨 熱門消息:LG 人工智慧研究發布 EXAONE 3.5:三個開源雙語前沿人工智慧模型,提供無與倫比的指令跟隨和長上下文理解,實現生成式人工智慧卓越的全球領導地位……。



新聞來源

本文由 AI 台灣 使用 AI 編撰,內容僅供參考,請自行進行事實查核。加入 AI TAIWAN Google News,隨時掌握最新 AI 資訊!

Tags: 這篇AI論文介紹了SRDF一個自我精煉的數據飛輪用於高品質的視覺與語言導航數據集
Previous Post

信用卡詐騙偵測與不同取樣技術 | 作者:米提莉·克里希南 | 2024年12月

Next Post

中國警方試驗兩棲犯罪偵查機器人球體

Related Posts

AI 助力中風患者康復Devon 的 SAMueL-2 計畫創新突破
AI 綜合新聞

AI 助力中風患者康復Devon 的 SAMueL-2 計畫創新突破

2025-04-24
2027 年 AI 預測人類水平 AI 的全新里程碑
AI 綜合新聞

2027 年 AI 預測人類水平 AI 的全新里程碑

2025-04-21
全球AI教育市場蓬勃發展智慧學習工具引領新趨勢
AI 綜合新聞

全球AI教育市場蓬勃發展智慧學習工具引領新趨勢

2025-04-21
AI 技術對人類智能的影響我們在失去什麼?
AI 綜合新聞

AI 技術對人類智能的影響我們在失去什麼?

2025-04-20
人工智慧重塑遊戲開發遊戲未來從現在開始
AI 綜合新聞

人工智慧重塑遊戲開發遊戲未來從現在開始

2025-04-18
MIT 研發新技術提升 AI 生成代碼準確性助力非專業人士掌握 SQL 語言
AI 綜合新聞

MIT 研發新技術提升 AI 生成代碼準確性助力非專業人士掌握 SQL 語言

2025-04-18
Next Post
中國警方試驗兩棲犯罪偵查機器人球體

中國警方試驗兩棲犯罪偵查機器人球體

BiMediX2:一個突破性的雙語生物醫學大型多模態模型,整合文本和圖像分析以進行先進的醫療診斷

BiMediX2:一個突破性的雙語生物醫學大型多模態模型,整合文本和圖像分析以進行先進的醫療診斷

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Archives

  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 10 月
  • 2023 年 9 月
  • 2023 年 8 月
  • 2023 年 7 月
  • 2023 年 5 月
  • 2023 年 3 月
  • 2023 年 1 月
  • 2022 年 12 月
  • 2022 年 11 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 1 月
  • 2021 年 11 月
  • 2021 年 8 月
  • 2021 年 5 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月
  • 2020 年 10 月
  • 2020 年 9 月
  • 2019 年 7 月
  • 2018 年 11 月

Categories

  • AI 智慧產業
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • 安全
  • 機器人與自動化
  • 機器學習與應用
  • 神經連結和腦機接口
  • 自然語言處理
  • 道德與法規
Your Ad
  • 關於我們
  • 廣告合作
  • 免責聲明
  • 隱私權政策
  • DMCA
  • Cookie 隱私權政策
  • 條款與條件
  • 聯絡我們
AI TAIWAN

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。