探索與利用:人類和猕猴的行為研究
也許這是一種生活小技巧,也可能是一種缺陷,或者兩者兼而有之。麻省理工學院(MIT)的一項新研究顯示,人類和動物都有一種天生的傾向,會不斷更新他們對任務的處理方式,即使他們已經學會了應該怎麼做,甚至這些改變有時會導致不必要的錯誤。
這種在可以“利用”時卻選擇“探索”的行為,至少有兩個原因。這項研究的資深作者Mriganka Sur表示,任務的規則即使在某一時刻看起來是固定的,但在這個不確定的世界中,它們不一定會一直保持不變。因此,偶爾改變行為可能有助於揭示需要調整的地方。此外,即使你已經知道自己喜歡什麼,嘗試新事物也是發現是否有更好的選擇的一種方式。
Sur教授說:“如果目標是最大化獎勵,一旦找到完美的解決方案,你就不應該偏離,但你仍然會繼續探索。為什麼?這就像食物。我們都喜歡某些食物,但我們仍然會嘗試不同的食物,因為你永遠不知道,可能會有你能發現的新美味。”
預測時間
前研究技術員Tudor Dragoi,現在是波士頓大學的研究生,領導了這項研究。他和Sur實驗室的其他成員探索了人類和小猕猴(marmosets)如何預測事件的時間。
三名人類和兩隻小猕猴被給予一個簡單的任務。他們會在螢幕上看到一張圖片,顯示的時間會有所不同,然後他們需要在圖片消失時按下按鈕(小猕猴用平板點擊,人類則用滑鼠)。成功的標準是盡快反應圖片消失,而不會過早按下按鈕。小猕猴在成功的試驗中會獲得果汁獎勵。
雖然小猕猴需要比人類更多的訓練時間,但所有受試者在這個任務上都形成了相似的合理行為模式。圖片在螢幕上顯示的時間越長,他們對圖片消失的反應時間就越快。這種行為遵循了“危險模型”的預測,即如果圖片只能持續一段時間,那麼它越長時間出現,就越可能很快消失。受試者學會了這一點,隨著經驗的增加,他們的反應時間變得更快。
但是,隨著實驗的進行,Sur和Dragoi的團隊注意到還有一些驚人的現象。對反應時間數據的數學建模顯示,人類和小猕猴都讓前一次試驗的結果影響他們在下一次試驗中的行為,即使他們已經學會了應該怎麼做。如果圖片在某次試驗中顯示的時間很短,那麼在下一輪中,受試者會稍微減少反應時間(可能預期圖片再次顯示的時間會更短),而如果圖片顯示的時間較長,他們則會增加反應時間(可能因為他們認為需要等待更長的時間)。
這些結果與Sur實驗室在2023年發表的一項類似研究相呼應。在那項研究中,即使老鼠已經學會了不同認知任務的規則,它們仍然會不定期地偏離成功策略。在這項研究中,學習成功策略並沒有阻止受試者繼續測試其他選擇,即使這意味著要放棄獎勵。
科學家們在新研究中寫道:“即使在任務學習之後,行為變化的持續性可能反映了探索作為尋找和建立最佳內部環境模型的策略。”
與自閉症的關聯
人類和小猕猴行為的相似性是一個重要的發現,Sur表示。因為對環境的預測能力差異被認為是自閉症譜系障礙的一個顯著特徵。由於小猕猴體型小,社交性強,且認知能力比老鼠更複雜,一些實驗室已開始建立小猕猴的自閉症模型,但關鍵是要證明它們能很好地模擬與自閉症相關的行為。這項研究通過證明小猕猴在預測方面模擬了神經典型人類行為,因此為小猕猴在自閉症研究中的應用提供了支持。
除了Dragoi和Sur,這篇論文的其他作者還包括Hiroki Sugihara、Nhat Le、Elie Adam、Jitendra Sharma、Guoping Feng和Robert Desimone。
這項研究得到了西蒙斯基金會自閉症研究倡議的支持,通過麻省理工學院社會大腦中心進行。
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!