模型參數超 RFdiffusion 5倍!英偉達等發布 Proteina,從頭設計蛋白質主鏈性能達 SOTA
該成果入選 ICLR 2025 Oral
原標題:模型參數超 RFdiffusion 5倍!英偉達等發布 Proteina,從頭設計蛋白質主鏈性能達 SOTA
文章來源:HyperAI超神經
內容字數:10159字
AI賦能蛋白質設計:從結構預測到從頭設計
本文概述了人工智能技術在蛋白質設計領域的最新進展,特別是英偉達聯合其他研究機構開發的Proteina模型,以及中國在該領域的創新成果。
蛋白質設計領域的挑戰與AI的突破
自上世紀以來,科學家們一直致力于預測蛋白質結構和設計全新蛋白質。AI技術的興起,特別是深度學習的應用,為這一領域注入了新的活力。2016年,深度殘差網絡ResNet的引入顯著提升了蛋白質殘基接觸預測的準確性,為AI與蛋白質設計的深度融合奠定了基礎。此后,AlphaFold等模型的出現,將蛋白質結構預測推向了新的高度。然而,以往的蛋白質結構生成模型通常規模較小,數據量有限,缺乏有效的控制手段。
Proteina模型:大規模流式蛋白質主鏈生成器
為了克服現有模型的局限性,英偉達聯合Mila、蒙特利爾大學和麻省理工學院的研究團隊開發了Proteina模型。Proteina采用可擴展非等變Transformer架構,參數量是RFdiffusion模型的5倍,訓練數據擴展到2100萬個合成蛋白質結構。它能夠生成高達800個殘基的主鏈,并保持多樣性和可設計性,在從頭設計蛋白質主鏈方面達到了最先進的性能。Proteina在訓練中使用了創新的方法,包括調整流匹配目標、分階段訓練策略以及新的引導方案,以增強蛋白質的可設計性。其研究成果已入選ICLR 2025 Oral。
中國在AI蛋白質設計領域的貢獻
中國在AI驅動的蛋白質設計領域也取得了顯著進展。多個研究團隊和企業開發了具有自主知識產權的蛋白質設計平臺和模型,例如:上海天壤XLab的TRDesign平臺、分子之心的NewOrigin大模型、無錫途深智合的TourSynbio大模型、中科院計算所的CarbonNovo模型以及中科大團隊的SCUBA-D模型等。這些模型在蛋白質結構預測、序列設計和從頭設計等方面展現出強大的能力,并已在產業應用中得到驗證。這些成果體現了中國在該領域的創新實力和技術積累。
未來展望
隨著AI技術的不斷發展,以及大語言模型在蛋白質設計領域的應用,該領域有望取得更多突破。中國在AI驅動的蛋白質設計領域已形成獨特的技術生態,未來將涌現更多創新成果,為全球生命科學研究和生物醫藥產業發展做出貢獻。
聯系作者
文章來源:HyperAI超神經
作者微信:
作者簡介:解構技術先進性與普適性,報道更前沿的 AIforScience 案例