顛覆蛋白質(zhì)優(yōu)化:浙江大學(xué)團(tuán)隊在NeurIPS 2024揭示的前沿技術(shù)亮點(diǎn)
參加直播有機(jī)會贏取算力福利
原標(biāo)題:直播預(yù)告 | 蛋白質(zhì)優(yōu)化新突破!浙江大學(xué)成果入選NeurIPS 2024,論文一作詳解技術(shù)亮點(diǎn)
文章來源:HyperAI超神經(jīng)
內(nèi)容字?jǐn)?shù):3923字
Meet AI4S系列直播第五期介紹
「Meet AI4S」系列直播將于12月10日19:00準(zhǔn)時上線,本期特別邀請到浙江大學(xué)知識引擎實驗室的博士研究生王澤元,分享的主題為「借助擴(kuò)散去噪過程助力大模型對蛋白質(zhì)的優(yōu)化」。
分享主題及研究背景
王澤元博士將深入探討其團(tuán)隊提出的全新去噪蛋白質(zhì)語言模型(DePLM)。該模型通過過濾與目標(biāo)特性無關(guān)的信息,提升蛋白質(zhì)適應(yīng)性景觀的預(yù)測精度。研究表明,DePLM在預(yù)測蛋白質(zhì)突變效應(yīng)方面超越了現(xiàn)有的先進(jìn)方法,并展現(xiàn)出強(qiáng)大的泛化能力,結(jié)果已被NeurIPS 2024會議接受。
觀眾獲益
參與本次直播的觀眾將能夠:
- 了解蛋白質(zhì)適應(yīng)性景觀預(yù)測的方法、數(shù)據(jù)集和評估指標(biāo)。
- 掌握擴(kuò)散模型增強(qiáng)的語言模型(DePLM)在適應(yīng)性景觀預(yù)測中的應(yīng)用。
- 探討進(jìn)化信息及濕實驗數(shù)據(jù)如何結(jié)合,以支持AI模型的訓(xùn)練。
研究亮點(diǎn)
DePLM模型通過優(yōu)化進(jìn)化信息,有效提高了蛋白質(zhì)的優(yōu)化效率。其關(guān)鍵創(chuàng)新在于設(shè)計了一種基于排序的前向擴(kuò)散過程,將學(xué)習(xí)目標(biāo)從最小化數(shù)值誤差轉(zhuǎn)變?yōu)樽畲蠡判蛳嚓P(guān)性。這一策略確保了模型在各種數(shù)據(jù)集上的強(qiáng)大泛化能力。
數(shù)據(jù)集與模型架構(gòu)
研究使用了ProteinGym蛋白質(zhì)突變數(shù)據(jù)集,最終選取201個深度突變篩選數(shù)據(jù)。DePLM模型利用從PLM中提取的進(jìn)化似然生成特定屬性的去噪似然,從而預(yù)測突變的影響。通過特征編碼器和去噪模塊,模型過濾掉無關(guān)噪聲,確保了高效的預(yù)測能力。
實驗室及組織背景
浙江大學(xué)知識引擎實驗室專注于知識圖譜、大型語言模型及AI for Science等領(lǐng)域的研究。與多家知名企業(yè)建立了聯(lián)合研發(fā)中心,旨在推動相關(guān)領(lǐng)域的學(xué)術(shù)研究與產(chǎn)業(yè)應(yīng)用。HyperAI超神經(jīng)作為中國最大的數(shù)據(jù)科學(xué)領(lǐng)域搜索引擎,致力于分享AI for Science的最新科研成果,已舉辦多期直播活動,促進(jìn)學(xué)術(shù)與產(chǎn)業(yè)的深度交流。
參與方式
歡迎大家掃碼預(yù)約直播,參與互動,并有機(jī)會贏取10小時的NVIDIA RTX A6000資源!
聯(lián)系作者
文章來源:HyperAI超神經(jīng)
作者微信:
作者簡介:解構(gòu)技術(shù)先進(jìn)性與普適性,報道更前沿的 AIforScience 案例