在快速發展的人工智慧 (AI) 領域,開發能夠準確模擬和預測現實世界結果的模型變得越來越重要,這將促進下一代物理 AI 系統的發展。
英偉達 (NVIDIA) 的研究副總裁劉明宇 (Ming-Yu Liu) 是 IEEE 會士,他參加了英偉達 AI 播客,討論世界基礎模型 (WFM) 的重要性——這是一種強大的神經網絡,能夠模擬物理環境。WFM 可以根據文字或圖像輸入數據生成詳細的視頻,並通過將當前狀態(圖像或視頻)與行動(例如提示或控制信號)結合來預測場景的演變。
劉明宇表示:「世界基礎模型對於物理 AI 開發者來說非常重要。它們可以想像許多不同的環境,並能夠模擬未來,讓我們能夠根據這些模擬做出良好的決策。」
這對於物理 AI 系統,像是機器人和自駕車,特別有價值,因為這些系統必須安全且有效地與現實世界互動。
為什麼世界基礎模型重要?
建立世界模型通常需要大量數據,而這些數據的收集可能既困難又昂貴。WFM 可以生成合成數據,提供豐富多樣的數據集,增強訓練過程。
此外,在現實世界中訓練和測試物理 AI 系統可能需要大量資源。WFM 提供虛擬的 3D 環境,開發者可以在受控的環境中模擬和測試這些系統,而不必承擔現實世界試驗的風險和成本。
開放訪問世界基礎模型
在 CES 展會上,英偉達宣布推出 NVIDIA Cosmos,這是一個生成性 WFM 平台,旨在加速物理 AI 系統(如機器人和自駕車)的開發。
該平台設計為開放且可訪問,並包含基於擴散和自回歸架構的預訓練 WFM,以及能夠將視頻壓縮為標記的標記器,供變壓器模型使用。
劉明宇解釋說,通過這些開放模型,企業和開發者擁有構建大規模模型所需的所有成分。這個開放平台還為團隊提供了靈活性,可以探索各種訓練和微調模型的選項,或根據特定需求構建自己的模型。
提升各行業的 AI 工作流程
WFM 預計將提升各行業的 AI 工作流程和開發。劉明宇認為,兩個領域將特別受到影響:
劉明宇表示:「自駕車產業和人形機器人產業將從世界模型的發展中獲益良多。WFM 可以模擬在現實世界中難以實現的不同環境,以確保代理的行為是合適的。」
對於自駕車,這些模型可以模擬環境,進行全面的測試和優化。例如,自駕車可以在各種模擬的天氣條件和交通情境中進行測試,以確保它在上路前能安全有效地運行。
在機器人技術方面,WFM 可以模擬和驗證機器人在不同環境中的行為,以確保它們在部署前能安全有效地執行任務。
英偉達正在與 1X、火幣 (Huobi) 和小鵬汽車 (XPENG) 等公司合作,幫助解決物理 AI 開發中的挑戰,推進他們的系統。
劉明宇表示:「我們仍然處於世界基礎模型發展的初期——它有用,但我們需要讓它變得更有用。我們還需要研究如何將這些世界模型最佳整合到物理 AI 系統中,以真正使其受益。」
收聽劉明宇的播客,或閱讀文字紀錄。
想了解更多關於 NVIDIA Cosmos 和最新的生成 AI 及機器人技術公告,可以觀看英偉達創辦人兼首席執行官黃仁勳 (Jensen Huang) 在 CES 開幕演講中的內容,並參加英偉達在展會上的會議。
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!