登Nature子刊!北大團隊用AI預(yù)測新冠/艾滋病/流感病毒進化方向,精度提升67%
可跨病毒類型、跨毒株預(yù)測,泛化能力極佳
原標題:登Nature子刊!北大團隊用AI預(yù)測新冠/艾滋病/流感病毒進化方向,精度提升67%
文章來源:HyperAI超神經(jīng)
內(nèi)容字數(shù):10141字
北京大學(xué)團隊研發(fā)E2VD框架,精準預(yù)測病毒進化
本文介紹了北京大學(xué)信息工程學(xué)院田永鴻教授、陳杰副教授團隊與廣州國家實驗室周鵬研究員合作,由博士生聶志偉、碩士生劉旭東等完成的一項重要研究成果:進化驅(qū)動的病毒變異驅(qū)動力預(yù)測框架E2VD。該框架發(fā)表于2025年1月17日的《Nature Machine Intelligence》雜志,能夠精準預(yù)測新冠病毒、流感病毒、寨卡病毒和艾滋病病毒的進化方向,為疫苗和藥物的快速優(yōu)化提供了重要支持。
1. 研究背景:病毒變異預(yù)測的挑戰(zhàn)
病毒的高變異性和突變的隨機性,導(dǎo)致有益突變(正樣本)極其稀少,這給深度學(xué)習(xí)模型的訓(xùn)練帶來了巨大挑戰(zhàn)。此外,病毒突變位點有限,也使得模型難以捕捉微弱的分子內(nèi)相互作用變化。
2. E2VD框架:創(chuàng)新性設(shè)計
為了解決上述難題,研究團隊提出了E2VD框架,該框架包含三個主要模塊:
蛋白質(zhì)序列編碼模塊:自主訓(xùn)練的定制化蛋白質(zhì)大語言模型,精準提取病毒蛋白序列特征。
局部-全局相互作用依賴融合模塊:利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)和動態(tài)注意力機制,捕捉突變與周圍氨基酸的相互作用,解決微弱突變效應(yīng)難以捕獲的問題。
多任務(wù)焦點學(xué)習(xí)模塊:結(jié)合多任務(wù)學(xué)習(xí)和難樣本挖掘策略,特別是設(shè)計了新穎的多任務(wù)焦點損失函數(shù)(Multi-task Focal Loss),提升模型對稀少有益突變的預(yù)測能力。
E2VD框架具有靈活的輸入輸出設(shè)計,可以用于多種病毒類型和預(yù)測任務(wù),例如結(jié)合親和力、表達量、抗體逃逸能力等。
3. 實驗結(jié)果:顯著提升預(yù)測精度和泛化能力
實驗結(jié)果表明,E2VD在預(yù)測有益突變的精度上提升了67%,顯著超越了其他主流方法。定制化的蛋白質(zhì)語言模型在參數(shù)量更少的情況下,也取得了優(yōu)于大型模型ESM2-15B的效果。E2VD還展現(xiàn)出極佳的泛化能力,能夠跨病毒類型、跨毒株進行準確預(yù)測。
4. E2VD的應(yīng)用和未來展望
E2VD能夠解釋病毒進化路徑、預(yù)測高風(fēng)險突變,并模擬病毒在真實世界中的進化軌跡。未來,團隊計劃將E2VD與疫苗和蛋白藥物設(shè)計流程結(jié)合,提高設(shè)計效率和可控性,為病毒防治和藥物設(shè)計帶來突破。
5. 團隊背景及其他研究成果
該團隊在AI for Life Science領(lǐng)域擁有深厚積累,曾獲得2022年度“戈登貝爾新冠特別獎”,并在高性能計算應(yīng)用方面取得了顯著成果,例如開發(fā)針對SARS-CoV-2 RBD突變模擬的高通量篩選方法以及多用途酶-底物相互作用預(yù)測框架MESI。
總而言之,E2VD框架為病毒進化預(yù)測提供了強大的工具,為應(yīng)對未來新發(fā)病毒感染提供了重要保障,也為AI在生命科學(xué)領(lǐng)域的應(yīng)用提供了新的范例。
聯(lián)系作者
文章來源:HyperAI超神經(jīng)
作者微信:
作者簡介:解構(gòu)技術(shù)先進性與普適性,報道更前沿的 AIforScience 案例