GPT-4無師自通預(yù)測蛋白質(zhì)結(jié)構(gòu)登Nature子刊!LLM全面進(jìn)軍生物學(xué),AlphaFold被「偷家」?
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:GPT-4無師自通預(yù)測蛋白質(zhì)結(jié)構(gòu)登Nature子刊!LLM全面進(jìn)軍生物學(xué),AlphaFold被「偷家」?
關(guān)鍵字:報(bào)告,結(jié)構(gòu),建模,氨基酸,模型
文章來源:新智元
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
新智元報(bào)道編輯:喬楊
【新智元導(dǎo)讀】距離GPT-4首次發(fā)布已經(jīng)過去了將近一年半的時(shí)間,Nature最近發(fā)表的一篇報(bào)告卻探索出了這個(gè)「過氣」模型的新用途——氨基酸和蛋白質(zhì)的結(jié)構(gòu)建模。提到AI4Science, 尤其是AI在生物學(xué)領(lǐng)域的應(yīng)用,DeepMind的AlphaFold已經(jīng)成為了「出圈」的代表作,是生物學(xué)和計(jì)算交叉融合的里程碑。
2020年底,第一代AlphaFold就已經(jīng)能以原子級別的精度預(yù)測蛋白質(zhì)的三維形狀。然而,這僅僅是一個(gè)開始。
一個(gè)不那么明顯的事實(shí)是,與Meta FAIR研發(fā)的ESM系列不同,AlphaFold并非不是使用LLM構(gòu)建的,而是依賴于一種名為「多序列比對」(MSA)的方法,是生物信息學(xué)領(lǐng)域一種較為傳統(tǒng)的做法。
當(dāng)全球的目光聚焦于AlphaFold時(shí),大語言模型在生物學(xué)領(lǐng)域的潛力或許被低估了。
去年,AI專欄作家、Radical VC合伙人Rob Toews在《福布斯》雜志上發(fā)表了一篇文章,預(yù)言LLM在生物領(lǐng)域的潛力。
相比速度慢且計(jì)算量大的MSA方法,LLM在規(guī)模化預(yù)測方面有更大的優(yōu)勢,而且能產(chǎn)生同樣準(zhǔn)確,甚至更準(zhǔn)確的結(jié)構(gòu)預(yù)測。
此外,語言模型能夠?qū)Φ鞍踪|(zhì)的
原文鏈接:GPT-4無師自通預(yù)測蛋白質(zhì)結(jié)構(gòu)登Nature子刊!LLM全面進(jìn)軍生物學(xué),AlphaFold被「偷家」?
聯(lián)系作者
文章來源:新智元
作者微信:
作者簡介: