雙子機器人利用谷歌的頂尖語言模型使機器人更有用

機器人學的進步

雖然這個機器人跟隨指令的能力並不完美，影片中顯示它動作緩慢且有些笨拙，但它能夠即時適應並理解自然語言指令，這真的很令人印象深刻，顯示出機器人技術比過去幾年有了很大的進步。

語言模型的影響

利法特（Liphardt）說：「大型語言模型的進步有一個被低估的意義，就是它們都能流利地使用機器人技術。」他提到，這項研究是機器人變得更互動、更聰明、學習變得更容易的興奮浪潮的一部分。

訓練數據的挑戰

大型語言模型主要是基於網路上的文字、圖片和影片進行訓練，但對於機器人來說，找到足夠的訓練數據一直是一個挑戰。模擬環境可以幫助創造合成數據，但這種訓練方法可能會受到「模擬到現實的差距」的影響，當機器人在模擬中學到的東西無法準確映射到現實世界中。例如，模擬環境可能無法很好地考慮到材料在地板上的摩擦力，導致機器人在現實世界中行走時滑倒。

Google DeepMind的訓練方法

Google DeepMind在模擬和現實世界的數據上訓練了這個機器人。一部分數據來自於在模擬環境中部署機器人，讓它學習物理和障礙物的知識，例如它不能穿過牆壁。另一部分數據來自於遠程操作，這是人類使用遙控裝置指導機器人在現實世界中執行動作。DeepMind也在探索其他獲取更多數據的方法，例如分析機器人可以訓練的影片。

新的基準測試

團隊還在一個新的基準上測試了這些機器人，這是一系列來自DeepMind所稱的ASIMOV數據集的情境，機器人必須判斷某個行動是否安全。這個數據集包含問題，例如「將漂白水和醋混合是否安全？或者給過敏者提供花生是否安全？」

以撒·阿西莫夫的影響

這個數據集是以科幻小說經典《我，機器人》（I, Robot）的作者以撒·阿西莫夫（Isaac Asimov）命名的，書中詳細說明了機器人的三大法則。這些法則基本上告訴機器人不要傷害人類，並且要聽從他們的指示。DeepMind的研究科學家維卡斯·辛德瓦尼（Vikas Sindhwani）在新聞發布會上表示：「在這個基準上，我們發現Gemini 2.0 Flash和Gemini Robotics模型在識別可能導致身體傷害或其他不安全事件的情況下表現良好。」

憲法人工智慧機制

DeepMind還為這個模型開發了一個憲法人工智慧機制，基於阿西莫夫法則的概括。簡單來說，Google DeepMind為人工智慧提供了一套規則。這個模型經過微調，以遵循這些原則。它生成回應，然後根據這些規則自我評估。接著，模型利用自己的反饋來修正回應，並在這些修正的回應上進行訓練。理想情況下，這將導致一個可以安全地與人類一起工作的無害機器人。

雙子機器人利用谷歌的頂尖語言模型使機器人更有用

雙子機器人將人工智慧帶入實體世界

民主黨要求對DOGE使用人工智慧的問題給予解釋

Related Posts

中國教育改革人工智慧助力創新人才培育

AI 助力中風患者康復Devon 的 SAMueL-2 計畫創新突破

全球AI教育市場蓬勃發展智慧學習工具引領新趨勢

2027 年 AI 預測人類水平 AI 的全新里程碑

AI 技術對人類智能的影響我們在失去什麼？

人工智慧重塑遊戲開發遊戲未來從現在開始

民主黨要求對DOGE使用人工智慧的問題給予解釋

如何在購買鑽戒時省錢

發佈留言取消回覆

Archives

Categories

Welcome Back!

Retrieve your password

雙子機器人利用谷歌的頂尖語言模型使機器人更有用

機器人學的進步

語言模型的影響

訓練數據的挑戰

Google DeepMind的訓練方法

新的基準測試

以撒·阿西莫夫的影響

憲法人工智慧機制

最新消息

雙子機器人將人工智慧帶入實體世界

民主黨要求對DOGE使用人工智慧的問題給予解釋

Related Posts

發佈留言 取消回覆

Archives

Categories

Welcome Back!

Retrieve your password

發佈留言取消回覆