蛋白質的功能與定位
蛋白質是維持我們細胞運作的重要成分,細胞中有成千上萬種不同的蛋白質,每一種都有其特定的功能。研究人員早就知道蛋白質的結構決定了它的功能。最近,研究人員開始意識到蛋白質的定位對其功能也非常重要。細胞裡有許多不同的區域,幫助組織細胞內的各種成分。除了生物學教科書中常見的細胞器,這些區域還包括許多動態的、沒有膜的區域,這些區域可以集中某些分子以共同執行功能。因此,知道一種蛋白質的定位以及它與哪些其他蛋白質共存,可以幫助我們更好地理解這種蛋白質在健康或疾病細胞中的角色,但研究人員一直缺乏一種系統的方法來預測這些信息。
AlphaFold的誕生
蛋白質的結構已經研究了超過五十年,最終發展出人工智慧工具AlphaFold,這個工具可以根據蛋白質的氨基酸序列預測蛋白質的結構。AlphaFold和類似的模型已經成為研究中廣泛使用的工具。
ProtGPS模型的開發
蛋白質還包含一些氨基酸區域,這些區域不會折疊成固定的結構,但對於幫助蛋白質進入細胞中的動態區域非常重要。麻省理工學院 (MIT) 的理查德·楊 (Richard Young) 教授和他的同事們想知道這些區域的代碼是否可以用來預測蛋白質的定位,就像其他區域用來預測結構一樣。其他研究人員已經發現了一些編碼蛋白質定位的序列,並開始開發預測蛋白質定位的模型。然而,研究人員並不知道是否可以根據蛋白質的序列預測其在任何動態區域的定位,也沒有類似AlphaFold的工具來預測定位。
ProtGPS的功能
現在,楊教授和他的團隊建立了一個名為ProtGPS的模型。他們在2月6日發表在《科學》期刊上的論文中介紹了這個模型。研究人員展示了ProtGPS能夠預測蛋白質會定位到12種已知的區域中的哪一種,以及與疾病相關的突變是否會改變這種定位。此外,研究團隊還開發了一種生成算法,可以設計新的蛋白質,使其定位到特定的區域。
研究的希望
楊教授表示:“我希望這是朝著一個強大平台的第一步,讓研究蛋白質的人能夠進行他們的研究,並幫助我們理解人類如何發展成為複雜的生物體,突變如何干擾這些自然過程,以及如何生成治療假設和設計藥物來治療細胞中的功能障礙。”
模型的驗證
研究人員還用實驗測試了模型的許多預測結果。
巴茲拉伊 (Regina Barzilay) 說:“能夠從計算設計到實驗測試,讓我感到非常興奮。這個領域有很多令人興奮的論文,但99.9%的論文從未在真實系統中進行測試。多虧了我們與楊實驗室的合作,我們能夠進行測試,並真正了解我們的算法表現如何。”
模型的訓練與測試
研究人員在兩批已知定位的蛋白質上訓練和測試了ProtGPS。他們發現這個模型能夠高準確度地預測蛋白質的最終定位。研究人員還測試了ProtGPS預測基於與疾病相關的突變的蛋白質定位變化的能力。許多突變——基因及其相應蛋白質序列的變化——已被發現與疾病有關,但突變如何導致疾病症狀仍然未知。
突變與疾病的關聯
了解突變如何導致疾病的機制非常重要,因為這樣研究人員就可以開發治療來修復這一機制,預防或治療疾病。楊教授和同事們懷疑許多與疾病相關的突變可能通過改變蛋白質的定位來導致疾病。例如,一個突變可能使一種蛋白質無法進入包含重要夥伴的區域。
進一步的測試
他們通過將超過200,000種帶有疾病相關突變的蛋白質輸入ProtGPS,來測試這一假設,然後要求它預測這些突變蛋白質的定位,並測量正常版本與突變版本之間的預測變化。預測的重大變化表明定位可能發生變化。
研究結果
研究人員發現許多情況下,與疾病相關的突變似乎改變了蛋白質的定位。他們在細胞中測試了20個例子,使用熒光比較正常蛋白質和突變版本在細胞中的位置。實驗確認了ProtGPS的預測。總的來說,這些發現支持了研究人員的懷疑,即錯誤定位可能是一種被低估的疾病機制,並展示了ProtGPS作為理解疾病和識別新治療途徑的工具的價值。
細胞的複雜性
米特尼科夫 (Mitnikov) 說:“細胞是一個如此複雜的系統,擁有許多組件和複雜的相互作用網絡。用這種方法來擾動系統,看看結果,這真的很有趣,這樣我們可以推動細胞機制的發現,甚至基於此開發治療。”
未來的展望
研究人員希望其他人能像使用AlphaFold這樣的預測結構模型一樣,開始使用ProtGPS,推進各種蛋白質功能、功能障礙和疾病的研究。
超越預測的創新
研究人員對他們的預測模型的潛在用途感到興奮,但他們也希望這個模型能超越預測現有蛋白質的定位,並允許他們設計全新的蛋白質。目標是讓模型生成全新的氨基酸序列,這些序列在細胞中形成後,能夠定位到所需的位置。生成一種能夠實際執行功能的新蛋白質——在這種情況下,定位到特定細胞區域的功能——是非常困難的。為了提高模型成功的機會,研究人員限制了他們的算法,只設計自然界中存在的蛋白質。這是一種在藥物設計中常用的方法,因為自然界經過數十億年的演化,已經找到了哪些蛋白質序列有效,哪些無效。
實驗測試的成功
由於與楊實驗室的合作,機器學習團隊能夠測試他們的蛋白質生成器是否有效。模型的結果良好。在一輪測試中,它生成了10種旨在定位到核仁的蛋白質。當研究人員在細胞中測試這些蛋白質時,他們發現其中四種強烈地定位到核仁,其他的也可能有輕微的偏向該位置。
合作的價值
米哈伊爾 (Mikhael) 說:“我們實驗室之間的合作對我們所有人來說都是非常有益的。我們學會了彼此的語言,了解了細胞如何運作,並通過實驗測試我們的模型,找到了讓模型運作的關鍵,並使其表現更好。”
未來的治療設計
能夠以這種方式生成功能性蛋白質,可能會提高研究人員開發治療的能力。例如,如果一種藥物必須與定位在特定區域的目標相互作用,那麼研究人員可以使用這個模型設計一種藥物,使其也能定位到該區域。這應該會提高藥物的有效性,並減少副作用,因為藥物將花更多時間與目標相互作用,而不是與其他分子互動,造成非目標效應。
未來的可能性
機器學習團隊成員對利用他們從這次合作中學到的知識來設計具有其他功能的新蛋白質感到興奮,這將擴大治療設計和其他應用的可能性。
奇寧 (Chinn) 說:“許多論文顯示他們可以設計出可以在細胞中表達的蛋白質,但並不是說這些蛋白質具有特定的功能。我們實際上實現了功能性蛋白質設計,並且成功率相對於其他生成模型來說非常高。這讓我們感到非常興奮,也是我們希望進一步發展的方向。”
ProtGPS的未來
所有參與的研究人員都將ProtGPS視為一個令人興奮的開始。他們預計這個工具將用於了解定位在蛋白質功能和錯誤定位在疾病中的角色。此外,他們還希望擴展模型的定位預測,以包括更多類型的區域,測試更多的治療假設,並設計出越來越多功能的蛋白質,用於治療或其他應用。
基爾戈爾 (Kilgore) 說:“現在我們知道這種蛋白質定位的代碼存在,並且機器學習模型能夠理解這個代碼,甚至利用其邏輯創建功能性蛋白質,這為許多潛在的研究和應用打開了大門。”
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!