中國科學技術大學生命科學與醫學部教授劉海燕、副教授陳泉團隊與信息科學技術學院教授李厚強團隊合作,開發了一種基于深度學習為給定主鏈結構從頭設計氨基酸序列的算法ABACUS-R。經過實驗驗證,ABACUS-R的設計成功率和設計精度超過了原有統計能量模型ABACUS。研究成果北京時間7月21日發表于《自然-計算科學》。

一個來自天然蛋白的目標結構(天藍色)與相應從頭設計蛋白的晶體結構(綠色)疊合圖 課題組供圖
劉海燕、陳泉團隊長期致力于發展數據驅動的蛋白質設計方法,先后建立并實驗驗證了對給定主鏈結構設計氨基酸序列的統計能量函數ABACUS模型,以及利用神經網絡能量函數從頭設計主鏈結構的SCUBA模型。然而,基于傳統統計能量技術的ABACUS模型在成功率、計算效率等方面仍有不足。
近期有多項研究表明,用深度學習進行氨基酸序列設計,能夠在天然氨基酸殘基類型恢復率等計算指標上超過能量函數方法。但截至目前已正式發表的工作中,對相關方法的實驗驗證結果遠未達到能量函數方法的成功率。
劉海燕介紹,利用ABACUS-R進行序列設計的方法由兩部分組成。
第一部分是一個多任務預訓練的編碼-解碼器網絡,用于對單個氨基酸的結構和化學環境進行隱空間編碼,再解碼為包括中心殘基氨基酸類型在內的多種真實特征;第二部分是把該編碼解碼網絡迭代應用于目標主鏈的每個氨基酸殘基,直到獲得最大程度自洽的全序列。
在理論驗證的基礎上,團隊嘗試用實驗表征了ABACUS-R對3個天然主鏈結構重新設計的57條序列,其中86%的序列(49條)可溶表達并能折疊為穩定單體。實驗解析的5個高分辨晶體結構與目標結構高度一致。此外,與此前報道的從頭設計蛋白相似,ABACUS-R從頭設計的蛋白表現出超高熱穩定性,去折疊溫度大多可達100℃以上。
總的來說,相較于ABACUS模型,ABACUS-R序列設計更高的成功率和結構精度進一步增強了數據驅動蛋白質從頭設計方法的實用性。ABACUS-R還提供了一種對蛋白質局部結構信息的預訓練表示方式,可用于序列設計以外的其他任務。
審稿人認為,該研究“最新穎的貢獻在于對設計的充分實驗表征,包括晶體結構,以及可溶表達的高成功率。”
近日,華南農業大學教授王應祥團隊在國家自然科學基金等項目的資助下,研究揭示了模式植物擬南芥泛素連接酶后期促進復合物/細胞周期體(APC/C)調控減數分裂染色體正確分離的分子機制。該研究豐富了蛋白質泛素......
華東理工大學化學與分子工程學院、費林加諾貝爾獎科學家聯合研究中心教授郭志前團隊,創制了激活型化學遺傳學熒光探針,首次在活細胞中監測蛋白質成簇/解聚的精確狀態。相關研究近日作為VIP(VeryImpor......
日本名古屋大學研究團隊在最新一期《自然·生物技術》雜志上發表了一項名為“內部帽啟動翻譯”(ICIT)機制的創新研究。該機制下的仿佛戴著帽子的mRNA可產生200倍以上的蛋白質,為治療癌癥和蛋白質合成異......
中國科學院腦科學與智能技術卓越創新中心/上海腦科學與類腦研究中心研究員劉真、孫怡迪,博士后朱文成團隊,與復旦大學附屬中山醫院生殖醫學中心主治醫師木良善團隊、上海交通大學醫學院研究員李辰團隊合作,描繪了......
圖FUSEP化學生物學技術用于系統研究賴氨酸和非賴氨酸泛素化的位點信息在國家自然科學基金項目(22137004、22307062)資助下,清華大學藥學院尹航教授團隊在蛋白質泛素化研究領域取得新進展,開......
1月5日,記者從中國科協獲悉,中國科協青年人才托舉工程博士生專項計劃首批入選3226人,他們將在拓寬學術視野、增強學術鍛煉、加快學術成長等方面獲得專項培養,托舉期為2025年1月至2026年12月。中......
當前人工智能技術和產業有哪些熱點?我國人工智能產業發展呈現怎樣的特點?12月12日舉行的中國科學院人工智能產學研創新聯盟2024年會,為這些問題提供了答案。本次年會以“人工智能助力科研范式變革(AIf......
受大自然啟發,美國西北大學生物工程師團隊開發出一種植入皮下的傳感器,可實時跟蹤活體動物蛋白質水平的波動,測量炎癥標志物的變化。相關論文發表在《科學》雜志上,標志著醫學檢測領域的一個重要里程碑。為了檢測......
北京時間10月23日,在德國德雷斯頓舉行的2024HUPO大會頒獎典禮上,備受矚目的“ClinicalandTranslationalProteomicsAward”(臨床轉化蛋白質組學獎)榮耀加冕于......
在今年諾貝爾化學獎表彰計算蛋白質設計領域的重大進展后,美國能源部阿貢國家實驗室團隊宣布開發出一種名為MProt-DPO的創新計算框架,該框架利用人工智能(AI)和世界頂尖的超級計算機,推動蛋白質設計取......