登Nature子刊!北大團隊用AI預測新冠/艾滋病/流感病毒進化方向,精度提升67%
可跨病毒類型、跨毒株預測,泛化能力極佳
原標題:登Nature子刊!北大團隊用AI預測新冠/艾滋病/流感病毒進化方向,精度提升67%
文章來源:HyperAI超神經(jīng)
內容字數(shù):10141字
北京大學團隊研發(fā)E2VD框架,精準預測病毒進化
本文介紹了北京大學信息工程學院田永鴻教授、陳杰副教授團隊與廣州國家實驗室周鵬研究員合作,由博士生聶志偉、碩士生劉旭東等完成的一項重要研究成果:進化驅動的病毒變異驅動力預測框架E2VD。該框架發(fā)表于2025年1月17日的《Nature Machine Intelligence》雜志,能夠精準預測新冠病毒、流感病毒、寨卡病毒和艾滋病病毒的進化方向,為疫苗和藥物的快速優(yōu)化提供了重要支持。
1. 研究背景:病毒變異預測的挑戰(zhàn)
病毒的高變異性和突變的隨機性,導致有益突變(正樣本)極其稀少,這給深度學習模型的訓練帶來了巨大挑戰(zhàn)。此外,病毒突變位點有限,也使得模型難以捕捉微弱的分子內相互作用變化。
2. E2VD框架:創(chuàng)新性設計
為了解決上述難題,研究團隊提出了E2VD框架,該框架包含三個主要模塊:
蛋白質序列編碼模塊:自主訓練的定制化蛋白質大語言模型,精準提取病毒蛋白序列特征。
局部-全局相互作用依賴融合模塊:利用卷積神經(jīng)網(wǎng)絡(CNN)和動態(tài)注意力機制,捕捉突變與周圍氨基酸的相互作用,解決微弱突變效應難以捕獲的問題。
多任務焦點學習模塊:結合多任務學習和難樣本挖掘策略,特別是設計了新穎的多任務焦點損失函數(shù)(Multi-task Focal Loss),提升模型對稀少有益突變的預測能力。
E2VD框架具有靈活的輸入輸出設計,可以用于多種病毒類型和預測任務,例如結合親和力、表達量、抗體逃逸能力等。
3. 實驗結果:顯著提升預測精度和泛化能力
實驗結果表明,E2VD在預測有益突變的精度上提升了67%,顯著超越了其他主流方法。定制化的蛋白質語言模型在參數(shù)量更少的情況下,也取得了優(yōu)于大型模型ESM2-15B的效果。E2VD還展現(xiàn)出極佳的泛化能力,能夠跨病毒類型、跨毒株進行準確預測。
4. E2VD的應用和未來展望
E2VD能夠解釋病毒進化路徑、預測高風險突變,并模擬病毒在真實世界中的進化軌跡。未來,團隊計劃將E2VD與疫苗和蛋白藥物設計流程結合,提高設計效率和可控性,為病毒防治和藥物設計帶來突破。
5. 團隊背景及其他研究成果
該團隊在AI for Life Science領域擁有深厚積累,曾獲得2022年度“戈登貝爾新冠特別獎”,并在高性能計算應用方面取得了顯著成果,例如開發(fā)針對SARS-CoV-2 RBD突變模擬的高通量篩選方法以及多用途酶-底物相互作用預測框架MESI。
總而言之,E2VD框架為病毒進化預測提供了強大的工具,為應對未來新發(fā)病毒感染提供了重要保障,也為AI在生命科學領域的應用提供了新的范例。
聯(lián)系作者
文章來源:HyperAI超神經(jīng)
作者微信:
作者簡介:解構技術先進性與普適性,報道更前沿的 AIforScience 案例