利用人工智慧協助科學研究
創造一個獨特且有前景的研究假設是每位科學家的基本技能。但這也可能需要花費很多時間:新的博士生可能會花費第一年來決定他們的實驗要探索什麼。如果人工智慧能幫助他們呢?
麻省理工學院 (MIT) 的研究人員創造了一種方法,能夠自動生成和評估有前景的研究假設,這是透過人類與人工智慧的合作來實現的。在一篇新的論文中,他們描述了如何使用這個框架來創造與生物啟發材料領域未滿足的研究需求相符的證據驅動假設。
這項研究於週三發表在《先進材料》(Advanced Materials)上,合著者包括阿利雷扎·加法羅拉希 (Alireza Ghafarollahi),他是原子與分子力學實驗室 (LAMM) 的博士後研究員,以及馬庫斯·比勒 (Markus Buehler),他是麻省理工學院土木與環境工程及機械工程系的傑瑞·麥卡菲 (Jerry McAfee) 工程教授,並且是LAMM的主任。
什麼是SciAgents?
這個框架被研究人員稱為SciAgents,包含多個人工智慧代理,每個代理都有特定的能力和數據訪問權限,利用“圖形推理”方法,讓人工智慧模型使用知識圖來組織和定義不同科學概念之間的關係。這種多代理的方法模擬了生物系統如何作為基本組件的群體進行組織。比勒指出,這種“分而治之”的原則在生物學的許多層面上都是一個重要的範式,從材料到昆蟲群體再到文明,這些例子都顯示出整體智慧遠大於個體能力的總和。
比勒說:“透過使用多個人工智慧代理,我們試圖模擬科學家社群如何進行發現的過程。在麻省理工學院,我們是透過一群背景不同的人一起工作,在咖啡廳或麻省理工學院的無限走廊相遇。但這是非常偶然且緩慢的。我們的目標是模擬發現的過程,探索人工智慧系統是否能夠創造並做出發現。”
自動化好點子
最近的發展顯示,大型語言模型 (LLMs) 在回答問題、總結信息和執行簡單任務方面展現了驚人的能力。但在從零開始生成新想法方面,它們相當有限。麻省理工學院的研究人員希望設計一個系統,使人工智慧模型能夠執行更複雜的多步驟過程,超越僅僅回憶訓練期間學到的信息,來推斷和創造新知識。
他們的方法基礎是一個本體知識圖,這個圖組織並建立不同科學概念之間的聯繫。為了製作這些圖,研究人員將一組科學論文輸入生成式人工智慧模型。在之前的工作中,比勒使用一種稱為範疇理論的數學領域,幫助人工智慧模型將科學概念發展為圖形,這些圖形根植於定義組件之間的關係,並能夠通過一種稱為圖形推理的過程被其他模型分析。這使得人工智慧模型能夠以更原則化的方式理解概念,也能更好地跨領域進行概括。
比勒表示:“這對我們創造以科學為中心的人工智慧模型非常重要,因為科學理論通常根植於可概括的原則,而不僅僅是知識的回憶。透過讓人工智慧模型以這種方式‘思考’,我們可以超越傳統方法,探索人工智慧的更具創造性的用途。”
建立科學發現的AI系統
在最新的論文中,研究人員使用了約1000篇有關生物材料的科學研究,但比勒表示,知識圖可以使用更多或更少的研究論文來生成,適用於任何領域。
在建立圖形後,研究人員開發了一個科學發現的人工智慧系統,裡面有多個模型專門扮演系統中的特定角色。大多數組件是基於OpenAI的ChatGPT-4系列模型構建的,並利用一種稱為上下文學習的技術,這種技術讓提示提供有關模型在系統中角色的上下文信息,同時允許它從提供的數據中學習。
框架中的各個代理相互作用,共同解決一個複雜的問題,這是單獨的代理無法完成的。他們的第一個任務是生成研究假設。在從知識圖定義出子圖後,LLM的互動開始,這可以隨機發生或通過手動輸入論文中討論的關鍵詞對進行。
在這個框架中,研究人員命名為“本體學家”(Ontologist)的語言模型負責定義論文中的科學術語並檢查它們之間的聯繫,豐富知識圖。接著,一個名為“科學家1”(Scientist 1)的模型根據其發現意外特性和新穎性的能力來制定研究提案。提案中包括潛在發現的討論、研究的影響以及對潛在作用機制的猜測。一個名為“科學家2”(Scientist 2)的模型擴展了這個想法,建議具體的實驗和模擬方法,並提出其他改進。最後,一個“批評者”(Critic)模型突出了提案的優勢和劣勢,並建議進一步的改進。
比勒說:“這是建立一個專家團隊的過程,這些專家並不都是以相同的方式思考。他們必須有不同的思維方式和不同的能力。批評者代理被故意編程來批評其他人,因此不會每個人都同意並說這是一個好主意。會有一個代理說,‘這裡有一個弱點,你能更好地解釋嗎?’這使得輸出與單一模型的結果大不相同。”
系統中的其他代理能夠搜尋現有文獻,這為系統提供了一種不僅能評估可行性,還能創造和評估每個想法的新穎性的方法。
強化系統
為了驗證他們的方法,比勒和加法羅拉希基於“絲綢”和“能源密集型”這兩個詞建立了一個知識圖。使用這個框架,“科學家1”模型提議將絲綢與蒲公英基色素結合,創造出具有增強光學和機械性能的生物材料。該模型預測這種材料將比傳統絲綢材料強得多,並且加工所需的能量更少。
科學家2隨後提出建議,例如使用特定的分子動力學模擬工具來探索所提議材料的相互作用,並補充說,這種材料的一個好應用將是生物啟發的粘合劑。批評者模型隨後突出了所提材料的幾個優勢和改進空間,例如其可擴展性、長期穩定性和溶劑使用的環境影響。為了解決這些問題,批評者建議進行過程驗證的試點研究,並對材料的耐久性進行嚴格分析。
研究人員還進行了其他實驗,使用隨機選擇的關鍵詞,產生了有關更高效的仿生微流體芯片、增強膠原蛋白基支架的機械性能以及石墨烯與淀粉樣纖維的相互作用以創造生物電子設備的各種原創假設。
加法羅拉希說:“該系統能夠根據知識圖的路徑提出這些新的、嚴謹的想法。在新穎性和適用性方面,這些材料似乎是穩健且新穎的。在未來的工作中,我們將生成數千或數萬個新的研究想法,然後我們可以對它們進行分類,試圖更好地理解這些材料是如何生成的,以及如何進一步改進。”
未來的展望
未來,研究人員希望將新的信息檢索工具和運行模擬的工具納入他們的框架中。他們還可以輕鬆地將框架中的基礎模型更換為更先進的模型,使系統能夠隨著人工智慧的最新創新而適應。
比勒說:“由於這些代理之間的互動,即使是微小的模型改進,也會對系統的整體行為和輸出產生巨大影響。”
自從發布了一份包含他們方法的開源細節的預印本以來,研究人員已經接到數百個來自不同科學領域甚至金融和網絡安全等領域的使用框架的興趣聯繫。
比勒說:“有很多事情可以在不進入實驗室的情況下完成。你基本上希望在過程的最後才進入實驗室。實驗室是昂貴的,耗時長,因此你希望有一個系統能深入挖掘最佳想法,制定最佳假設並準確預測新興行為。我們的願景是讓這個系統易於使用,這樣你就可以使用應用程序引入其他想法或拖入數據集,真正挑戰模型以做出新的發現。”
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!