化學合成在醫療應用、材料科學和精細化學品的開發中非常重要。這個過程涉及計劃化學反應,以創造所需的目標分子,傳統上依賴於人類的專業知識。最近的進展轉向計算方法,以提高逆合成的效率——從目標分子向後推導出合成所需的一系列反應。研究人員希望利用現代計算技術,解決合成化學中的長期瓶頸,使這些過程變得更快、更準確。
逆合成中的一個關鍵挑戰是準確預測那些稀有或不常見的化學反應。這些反應雖然不常見,但對於設計新穎的化學路徑至關重要。傳統的機器學習模型往往無法預測這些反應,因為訓練數據中缺乏足夠的代表性。此外,多步逆合成計劃中的錯誤可能會連鎖反應,導致無效的合成路徑。這一限制妨礙了探索創新和多樣化的化學合成路徑的能力,特別是在需要不常見反應的情況下。
現有的逆合成計算方法主要集中在單步模型或基於規則的專家系統上。這些方法依賴於預定義的規則或大量的訓練數據集,這限制了它們對新型和獨特反應類型的適應性。例如,一些方法使用基於圖形或序列的模型來預測最可能的轉化。雖然這些方法提高了對常見反應的準確性,但它們往往缺乏靈活性,無法考慮稀有化學轉化的複雜性和細微差別,導致逆合成計劃的全面性不足。
來自微軟研究院 (Microsoft Research)、諾華生物醫藥研究 (Novartis Biomedical Research) 和雅蓋隆大學 (Jagiellonian University) 的研究人員開發了 Chimera,一個用於逆合成預測的集成框架。Chimera 整合了多個具有不同歸納偏見的機器學習模型的輸出,通過學習的排名機制結合它們的優勢。這種方法利用了兩個新開發的最先進模型:NeuralLoc,專注於使用圖神經網絡進行分子編輯,以及 R-SMILES 2,一個使用序列到序列的變壓器架構的全新模型。通過結合這些模型,Chimera 提高了逆合成預測的準確性和可擴展性。
Chimera 的方法論依賴於通過排名系統結合其組成模型的輸出,該系統根據模型的一致性和預測信心分配分數。NeuralLoc 將分子結構編碼為圖形,使得反應位點和模板的預測更加精確。這種方法確保預測的轉化與已知的化學規則緊密對齊,同時保持計算效率。與此同時,R-SMILES 2 利用先進的注意力機制,包括群體查詢注意力,來預測反應路徑。這個模型的架構還包含了正規化和激活函數的改進,確保了優越的梯度流和推斷速度。Chimera 結合這些預測,使用基於重疊的計分來對潛在路徑進行排名。這種整合確保了框架平衡基於編輯和全新方法的優勢,使其即使在複雜和稀有反應中也能進行穩健的預測。
Chimera 的性能已經在公開可用的數據集上進行了嚴格驗證,例如 USPTO-50K 和 USPTO-FULL,以及專有的 Pistachio 數據集。在 USPTO-50K 上,Chimera 在前十名預測準確性上比之前的最先進方法提高了 1.7%,顯示出其準確預測常見和稀有反應的能力。在 USPTO-FULL 上,它進一步提高了前十名的準確性 1.6%。將模型擴展到包含超過 USPTO-FULL 三倍數據的 Pistachio 數據集時,Chimera 在更廣泛的反應範圍內保持了高準確性。與有機化學家的專家比較顯示,Chimera 的預測始終優於單一模型,確認了其在實際應用中的有效性。
該框架還在一個包含超過 10,000 個反應的內部諾華數據集上進行了測試,以評估其在分佈變化下的穩健性。在這種零-shot 設定中,沒有進行額外的微調,Chimera 展現出比其組成模型更優越的準確性。這突顯了它在不同數據集之間的泛化能力,即使在現實場景中也能預測可行的合成路徑。此外,Chimera 在多步逆合成任務中表現優異,在 SimpRetro 等基準上達到了接近 100% 的成功率,顯著超越了單一模型。該框架在尋找高度挑戰性分子的路徑方面的能力進一步強調了其改變計算逆合成的潛力。
Chimera 代表了逆合成預測的一項突破性進展,通過解決稀有反應預測和多步計劃的挑戰。該框架通過整合多樣化的模型和採用穩健的排名機制,展現出優越的準確性和可擴展性。憑藉其在不同數據集之間的泛化能力和在複雜逆合成任務中的卓越表現,Chimera 將加速化學合成的進展,為分子設計的創新方法鋪平道路。
查看論文。所有研究的功勞都歸於這個項目的研究人員。還有,別忘了在 Twitter 上關注我們,加入我們的 Telegram 頻道和 LinkedIn 群組。別忘了加入我們的 60,000 多名機器學習 SubReddit。
🚨 熱門消息:LG AI 研究發布 EXAONE 3.5:三個開源雙語前沿 AI 等級模型,提供無與倫比的指令跟隨和長上下文理解,為生成 AI 卓越的全球領導地位提供支持……。
新聞來源
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的
AI TAIWAN 台灣人工智慧中心
FB 社團,隨時掌握最新 AI 動態與實用資訊!