入選頂會(huì)ICML,清華AIR等聯(lián)合發(fā)布蛋白質(zhì)語言模型ESM-AA,超越傳統(tǒng)SOTA
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:入選頂會(huì)ICML,清華AIR等聯(lián)合發(fā)布蛋白質(zhì)語言模型ESM-AA,超越傳統(tǒng)SOTA
關(guān)鍵字:蛋白質(zhì),模型,尺度,原子,分子
文章來源:HyperAI超神經(jīng)
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
作者:田小幺
編輯:鄭康杰,李姝
清華大學(xué)、北京大學(xué)、學(xué)的聯(lián)合研究團(tuán)隊(duì)提出了一種多尺度的蛋白質(zhì)語言模型 ESM-AA,在靶點(diǎn)-配體結(jié)合等任務(wù)上的性能顯著提升。作為細(xì)胞內(nèi)無數(shù)生化反應(yīng)的驅(qū)動(dòng)力,蛋白質(zhì)在細(xì)胞微觀世界中扮演著建筑師和工程師的角色,不僅催化著生命活動(dòng),更是構(gòu)筑、維系生物體形態(tài)與功能的基礎(chǔ)構(gòu)件。正是蛋白質(zhì)之間的互動(dòng)、協(xié)同作用,支撐起了生命的宏偉藍(lán)圖。
然而,蛋白質(zhì)的結(jié)構(gòu)復(fù)雜多變,傳統(tǒng)的實(shí)驗(yàn)方法在解析蛋白質(zhì)結(jié)構(gòu)時(shí)既耗時(shí)又費(fèi)力——蛋白質(zhì)語言模型 (PLMs) 應(yīng)運(yùn)而生,利用深度學(xué)習(xí)技術(shù),通過分析大量的蛋白質(zhì)序列數(shù)據(jù),學(xué)習(xí)蛋白質(zhì)的生物化學(xué)規(guī)律和共進(jìn)化模式,在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、適應(yīng)性預(yù)測(cè)和蛋白質(zhì)設(shè)計(jì)等領(lǐng)域取得了顯著成就,極大地推動(dòng)了蛋白質(zhì)工程的發(fā)展。
盡管 PLMs 在殘基尺度上取得了巨大成功,但在提供原子級(jí)信息方面的能力卻受到了限制。針對(duì)于此,清華大學(xué)智能產(chǎn)業(yè)研究院副研究員周浩聯(lián)合北京大學(xué)、學(xué)和水木分子團(tuán)隊(duì),提出了一種多尺度的蛋白質(zhì)語言模型 ESM-AA (ESM All Atom),通過設(shè)計(jì)殘基展開、多尺度位置編碼等訓(xùn)練機(jī)制,拓展出了處理原子尺度信息的能力。
ESM-AA
原文鏈接:入選頂會(huì)ICML,清華AIR等聯(lián)合發(fā)布蛋白質(zhì)語言模型ESM-AA,超越傳統(tǒng)SOTA
聯(lián)系作者
文章來源:HyperAI超神經(jīng)
作者微信:HyperAI
作者簡(jiǎn)介:解構(gòu)技術(shù)先進(jìn)性與普適性,報(bào)道更前沿的 AIforScience 案例