星期一, 16 6 月, 2025
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
No Result
View All Result
Your Ad
Home 機器學習與應用

ScreenSpot-Pro:首個基準測試將多模態 LLM 引入高解析度專業 GUI 代理和電腦使用環境

2025-01-06
in 機器學習與應用
0 0
0
ScreenSpot-Pro:首個基準測試將多模態 LLM 引入高解析度專業 GUI 代理和電腦使用環境
Share on FacebookShare on Twitter
Your Ad


在專業環境中,圖形使用者介面 (GUI) 代理面臨三個重要挑戰:(1) 專業應用程式比一般用途軟體更複雜,需要對複雜的佈局有詳細的理解;(2) 專業工具的解析度較高,導致目標尺寸變小,並降低了定位的準確性;(3) 依賴額外的工具和文件,使工作流程變得更加複雜。這些挑戰顯示出需要更先進的基準和解決方案,以提升 GUI 代理在這些要求高的情境中的表現。

目前的 GUI 定位模型和基準無法滿足專業環境的需求。像是 ScreenSpot 的工具設計用於低解析度的任務,缺乏能夠準確模擬現實情境的多樣性。像 OS-Atlas 和 UGround 的模型在計算上效率低下,當目標很小或介面圖示豐富時,常常無法正常運作,這在專業應用中很常見。此外,缺乏多語言支持也降低了它們在全球工作流程中的適用性。這些不足之處突顯了需要更全面和現實的基準來推進這個領域。

來自新加坡國立大學 (National University of Singapore)、華東師範大學 (East China Normal University) 和香港浸會大學 (Hong Kong Baptist University) 的研究團隊介紹了 ScreenSpot-Pro:一個專為專業高解析度環境量身定制的新框架。這個基準擁有 1,581 個任務的數據集,涵蓋 23 種應用程式,涉及開發、創意工具、計算機輔助設計 (CAD)、科學平台和辦公套件等行業。它包含高解析度的全螢幕視覺和專家註解,確保準確性和真實性。多語言指南涵蓋英語和中文,以擴大評估範圍。ScreenSpot-Pro 的獨特之處在於它記錄了實際工作流程,這些工作流程產生了真實且高品質的註解,因此成為評估和發展 GUI 定位模型的工具。

ScreenSpot-Pro 數據集捕捉了現實且具有挑戰性的情境。這個數據集的基礎是高解析度的圖像,目標區域平均僅佔整個螢幕的 0.07%,因此指向微小的 GUI 元素。數據由具有相關應用經驗的專業用戶收集,他們使用專業工具來確保註解的準確性。此外,該數據集支持多語言功能,以測試雙語功能,並包含多個工作流程以捕捉真實專業任務的細微差別。這些特點使其特別適合於評估和提升 GUI 代理的準確性和靈活性。

利用 ScreenSpot-Pro 分析當前的 GUI 定位模型顯示出它們在管理高解析度專業環境方面的重大不足。OS-Atlas-7B 的準確率達到最高的 18.9%。然而,像 ReGround 這樣的迭代方法顯示出提升性能的能力,通過多步驟的方法達到 40.2% 的準確率。小型元件,如圖示,帶來了顯著的困難,而雙語任務進一步突顯了模型的限制。這些發現強調了需要改進技術,以增強在複雜 GUI 情境中的上下文理解和韌性。

ScreenSpot-Pro 為專業高解析度環境中的 GUI 代理評估設立了一個變革性的基準。它針對複雜工作流程中的特定挑戰,提供多樣且精確的數據集,以指導 GUI 定位的創新。這一貢獻為更智能、更高效的代理奠定了基礎,支持專業任務的無縫執行,顯著提升各行各業的生產力和創新。

查看論文和數據。所有研究的功勞歸於這個項目的研究人員。此外,別忘了在 Twitter 上關注我們,並加入我們的 Telegram 頻道和 LinkedIn 群組。也別忘了加入我們的 60k+ 機器學習 SubReddit。

🚨 免費即將舉行的 AI 網路研討會 (2025年1月15日):利用合成數據和評估智慧提升 LLM 準確性——參加這個研討會,獲取提升 LLM 模型性能和準確性的可行見解,同時保護數據隱私。



新聞來源

本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!

Tags: GUIllmScreenSpotPro首個基準測試將多模態代理和電腦使用環境引入高解析度專業
Previous Post

預測球的軌跡。使用 NumPy 在 Python 中進行多項式擬合 | 由 Florian Trautweiler | 2025 年 1 月

Next Post

圖形生成預訓練變壓器(G2PT):一種自回歸模型,旨在通過下一個標記預測學習圖形結構

Related Posts

劍橋大學和莫納什大學的研究人員推出 ReasonGraph:一個可視化和分析大型語言模型推理過程的網絡平台
機器學習與應用

劍橋大學和莫納什大學的研究人員推出 ReasonGraph:一個可視化和分析大型語言模型推理過程的網絡平台

2025-03-16
生成式人工智慧的影響及其對數據科學家的啟示
機器學習與應用

生成式人工智慧的影響及其對數據科學家的啟示

2025-03-15
這篇AI論文介紹了BD3-LMs:一種結合自回歸模型和擴散模型的混合方法,用於可擴展和高效的文本生成
機器學習與應用

這篇AI論文介紹了BD3-LMs:一種結合自回歸模型和擴散模型的混合方法,用於可擴展和高效的文本生成

2025-03-15
九個生鏽的Pico PIO瓦特(第二部分)
機器學習與應用

九個生鏽的Pico PIO瓦特(第二部分)

2025-03-15
開始使用 Amazon Bedrock Agents 的電腦操作
機器學習與應用

開始使用 Amazon Bedrock Agents 的電腦操作

2025-03-15
評估使用 Amazon Bedrock 知識庫的 RAG 應用程式
機器學習與應用

評估使用 Amazon Bedrock 知識庫的 RAG 應用程式

2025-03-14
Next Post
圖形生成預訓練變壓器(G2PT):一種自回歸模型,旨在通過下一個標記預測學習圖形結構

圖形生成預訓練變壓器(G2PT):一種自回歸模型,旨在通過下一個標記預測學習圖形結構

3D 形狀標記化 – 蘋果機器學習研究

3D 形狀標記化 - 蘋果機器學習研究

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Archives

  • 2025 年 6 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 10 月
  • 2023 年 9 月
  • 2023 年 8 月
  • 2023 年 7 月
  • 2023 年 5 月
  • 2023 年 3 月
  • 2023 年 1 月
  • 2022 年 12 月
  • 2022 年 11 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 1 月
  • 2021 年 11 月
  • 2021 年 8 月
  • 2021 年 5 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月
  • 2020 年 10 月
  • 2020 年 9 月
  • 2019 年 7 月
  • 2018 年 11 月

Categories

  • AI 智慧產業
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • 安全
  • 機器人與自動化
  • 機器學習與應用
  • 神經連結和腦機接口
  • 自然語言處理
  • 道德與法規
Your Ad
  • 關於我們
  • 廣告合作
  • 免責聲明
  • 隱私權政策
  • DMCA
  • Cookie 隱私權政策
  • 條款與條件
  • 聯絡我們
AI TAIWAN

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。