科學家們的新發現:Evo 2 模型
現在,全球的科學家都可以使用 Evo 2,這是一個強大的新模型,能理解所有生命領域的基因密碼。今天,它被揭示為最大的公開可用的基因組數據人工智慧(AI)模型,這個模型是由非營利生物醫學研究組織 Arc Institute 和史丹佛大學 (Stanford University) 共同開發,並在 NVIDIA DGX Cloud 平台上建立。
Evo 2 現在可以在 NVIDIA BioNeMo 平台上供全球開發者使用,包括作為 NVIDIA NIM 微服務,方便安全地進行 AI 部署。
這個模型是基於近 9 兆個核苷酸的龐大數據集進行訓練的,這些核苷酸是 DNA 和 RNA 的基本組成部分。Evo 2 可以應用於生物分子研究,包括根據基因序列預測蛋白質的形狀和功能、識別新的分子以用於醫療和工業應用,還有評估基因突變如何影響其功能。
Arc Institute 的共同創始人和核心研究員、加州大學伯克利分校 (University of California, Berkeley) 的生物工程助理教授 Patrick Hsu 說:“Evo 2 代表了生成基因組學的一個重要里程碑。通過加深我們對生命基本組成部分的理解,我們可以追求在醫療和環境科學方面的解決方案,這些在今天是難以想像的。”
促進複雜的科學研究
Arc Institute 成立於 2021 年,獲得了 6.5 億美元的創始捐款,旨在幫助研究人員解決長期的科學挑戰,提供多年的資金支持,讓科學家專注於創新研究,而不是撰寫申請書。
其核心研究員可以獲得最先進的實驗室空間和八年可續期的資金,這些資金可以與該研究所的合作大學(包括史丹佛大學、加州大學伯克利分校和加州大學舊金山分校)同時進行。
通過將這種獨特的研究環境與 NVIDIA 的加速計算專業知識和資源相結合,Arc Institute 的研究人員可以追求更複雜的項目,分析更大的數據集,並更快地取得結果。他們的研究重點包括癌症、免疫功能障礙和神經退行性疾病等領域。
NVIDIA 通過在 AWS 上的 NVIDIA DGX Cloud 提供 2000 個 NVIDIA H100 GPU,加速了 Evo 2 項目的進展。DGX Cloud 提供短期訪問大型計算集群的能力,讓研究人員有靈活性進行創新。這個完全管理的 AI 平台包括 NVIDIA BioNeMo,提供優化的軟體,形式為 NVIDIA NIM 微服務和 NVIDIA BioNeMo 藍圖。
NVIDIA 的研究人員和工程師也在 AI 擴展和優化方面緊密合作。
生物分子科學的應用
Evo 2 可以提供有關 DNA、RNA 和蛋白質的見解。這個模型在各種生命領域的物種上進行訓練,包括植物、動物和細菌,可以應用於醫療、農業生物技術和材料科學等科學領域。
Evo 2 使用一種新型模型架構,可以處理長達 100 萬個標記的基因信息序列。這種對基因組的擴展視野可能會幫助科學家理解生物體基因密碼中遙遠部分之間的聯繫,以及細胞功能、基因表達和疾病的機制。
Hsu 說:“一個人類基因包含數千個核苷酸,因此,為了讓 AI 模型分析這樣複雜的生物系統,它需要一次處理基因序列的最大部分。”
在醫療和藥物發現方面,Evo 2 可以幫助研究人員了解哪些基因變異與特定疾病有關,並設計出精確針對這些區域的新分子來治療疾病。例如,來自史丹佛大學和 Arc Institute 的研究人員發現,在 BRCA1 基因的測試中,Evo 2 可以以 90% 的準確率預測先前未識別的突變是否會影響基因功能。
在農業方面,這個模型可以幫助解決全球糧食短缺問題,通過提供植物生物學的見解,幫助科學家開發更具氣候韌性或更富營養的作物品種。在其他科學領域,Evo 2 可以用於設計生物燃料或工程化能分解油或塑料的蛋白質。
Arc 的首席技術官 Dave Burke 說:“部署像 Evo 2 這樣的模型就像將一個強大的新望遠鏡送往宇宙的最遠處。我們知道有巨大的探索機會,但我們還不知道會發現什麼。”
想了解更多關於 Evo 2 的資訊,可以參考 NVIDIA 技術部落格和 Arc 的技術報告。
請參閱有關軟體產品資訊的通知。
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!