新創公司 Physical Intelligence 的機器人夢想
新創公司 Physical Intelligence (物理智慧) 並不打算製造機器人。相反,他們有更好的計畫:利用不斷學習的人工智慧 (AI) 軟體來驅動硬體,讓現有的機器能夠自主執行越來越多需要精確動作和靈活性的任務,包括家務。
在過去的一年裡,我們看到了機器狗跳舞,甚至有些機器狗還能噴火,還有越來越先進的人形機器人和專門用於組裝線的機器。不過,我們仍在等待《未來小子》(The Jetsons)中的 Rosey 機器人。
但我們可能很快就能看到這一天。位於舊金山的 Physical Intelligence (Pi) 公布了他們的通用 AI 模型,這個模型可以讓現有的機器執行各種任務,例如從烘乾機中取出衣物並摺疊、輕輕地將雞蛋放入容器中、研磨咖啡豆和清理桌子。想像一下,這些移動的金屬助手在家裡滾動,吸塵、裝卸洗碗機、整理床鋪、查看冰箱和儲藏室的內容並制定晚餐計畫,甚至還能煮晚餐,這一切都不是不可能的。
正因為這樣,Pi 公布了他們的「通用機器人基礎模型」,稱為 π0 (pi-zero)。
在 Physical Intelligence (π),我們的使命是將通用 AI 帶入物理世界。
我們很高興展示這個使命的第一步——我們的第一個通用模型 π₀ 🧠 🤖
論文、部落格、未剪輯影片:https://t.co/XZ4Luk8Dci pic.twitter.com/XHCu1xZJdq
— Physical Intelligence (@physical_int) 2024年10月31日
「我們相信這是朝著長期目標發展人工物理智慧的第一步,讓用戶可以像要求大型語言模型 (LLMs) 和聊天機器人助手一樣,直接要求機器人執行任何任務。」該公司解釋道。「與 LLMs 不同的是,我們的模型不僅能處理文字,還能處理圖像和動作,並通過訓練機器人的實際經驗來獲得物理智慧,學會直接輸出低層次的運動指令。它可以控制各種不同的機器人,並可以根據需要執行任務,或進行微調以專門應對挑戰性的應用場景。」
在他們的研究中,pi-zero 展示了各種需要不同靈活性和動作的工作,這些工作都可以由 AI 訓練的硬體來完成。總共,這個基礎模型執行了 20 項任務,這些任務都需要不同的技能和操作。
「我們選擇這些任務的目標不是為了解決特定的應用,而是為了開始為我們的模型提供對物理互動的基本理解——這是物理智慧的初步基礎。」團隊指出。
π₀ 是一個通用型 VLA 模型:- 它執行靈活的任務(如摺衣服、清理桌子等)- transformer+flow matching 結合了 VLM 預訓練和 50Hz 的連續行動優勢- 它在一個大型 π 數據集上進行預訓練,涵蓋多種形式 pic.twitter.com/zX9hvVdQuH
— Physical Intelligence (@physical_int) 2024年10月31日
我個人對機器人技術並不特別興奮,因為我們看到的大多數都是專門的機器人。老實說,我已經對人形機器人從 A 點搬運箱子到 B 點感到厭倦。在生物學中,專家在某個特定領域非常擅長,例如蜜蜂、蝴蝶和考拉,並且做得非常好。但當外部力量如棲息地喪失或疾病出現時
新聞來源
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!