最近的人工智慧模型
最近的人工智慧(AI)模型在生成文字、音訊和視頻方面表現得非常像人類。然而,這些演算法目前主要還停留在數位世界,而不是我們生活的實體三維世界。事實上,當我們試圖將這些模型應用到現實世界時,即使是最先進的模型也常常無法表現良好。想想看,開發安全可靠的自駕車有多麼困難。雖然這些模型是人工智慧,但它們對物理學的理解幾乎為零,並且經常會出現幻覺,導致它們犯下難以解釋的錯誤。
人工智慧的突破
不過,這一年,人工智慧終於將從數位世界跨越到我們所居住的現實世界。要將人工智慧擴展到數位邊界之外,需要重新設計機器的思考方式,將人工智慧的數位智能與機器人的機械能力結合起來。我稱之為「物理智能」,這是一種新的智能機器形式,可以理解動態環境、應對不確定性並即時做出決策。與傳統人工智慧模型不同,物理智能根植於物理學,理解現實世界的基本原則,例如因果關係。
物理智能的特點
這些特徵使物理智能模型能夠與不同的環境互動並適應。在我在麻省理工學院(MIT)的研究小組中,我們正在開發稱為液態網絡的物理智能模型。在一個實驗中,我們訓練了兩架無人機——一架由標準人工智慧模型操作,另一架由液態網絡操作——在夏天的森林中尋找物體,使用人類飛行員捕獲的數據。當兩架無人機被要求完成它們所受訓練的任務時,表現都一樣好,但當它們被要求在不同的情況下尋找物體——例如冬天或城市環境——只有液態網絡的無人機成功完成了任務。這個實驗告訴我們,與傳統的人工智慧系統不同,液態網絡在初始訓練階段後仍然能夠持續學習和適應,就像人類一樣。
物理智能的應用
物理智能還能解釋並實際執行來自文字或圖像的複雜指令,彌補數位指令與現實執行之間的差距。例如,在我的實驗室中,我們開發了一個物理智能系統,可以在不到一分鐘的時間內,根據像「可以向前走的機器人」或「可以抓取物體的機器人」這樣的提示,迭代設計並3D列印小型機器人。
其他實驗室的突破
其他實驗室也在取得重大突破。例如,機器人初創公司Covariant,由加州大學伯克利分校(UC-Berkeley)的研究員Pieter Abbeel創立,正在開發類似於ChatGPT的聊天機器人,這些聊天機器人可以在提示下控制機器手臂。他們已經獲得超過2.22億美元的資金,用於在全球倉庫開發和部署分揀機器人。卡內基梅隆大學(Carnegie Mellon University)的一組研究人員最近也展示了一個只用一個相機和不精確的驅動裝置的機器人,能夠執行動態和複雜的跑酷動作——包括跳上兩倍於其高度的障礙物和跨越兩倍於其長度的間隙——這都是通過一個使用強化學習訓練的單一神經網絡來實現的。
未來的展望
如果2023年是文字轉圖片的年,2024年是文字轉視頻的年,那麼2025年將標誌著物理智能的時代,將出現新一代設備——不僅是機器人,還包括從電力網到智慧家居的各種設備——它們能夠理解我們所說的內容並在現實世界中執行任務。
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!