AIGC動態歡迎閱讀
原標題:打破AlphaFold大模型局限,世界最大蛋白質相互作用數據集AlphaSeq橫空出世
關鍵字:蛋白質,細胞,數據,酵母,模型
文章來源:新智元
內容字數:0字
內容摘要:
新智元報道編輯:喬楊
【新智元導讀】雖然AlphaFold等系列的大模型已經在蛋白質預測方面取得了前所未有的突破,但依舊無法勝任蛋白質-蛋白質相互作用(PPI)這種復雜的任務。初創公司A-Alpha Bio的PPI數據集AlphaSeq,有望補足這方面的技術短板。隨著最近AlphaFold 3和ESM 3的相繼推出,我們看到了深度學習在生物學領域的無限潛力。
然而,Dyno Therapeutics的高級機器學習工程師Abihishaike Mahajan在上個月發布的一篇博文中指出了潛在的增長危機。
他認為,AlphaFold系列所取得的成果,即將一個強大的深度學習模型應用于一個已經存在大量數據的領域,從而引發一場徹底的——這是極難復制的。
原因還是數據。我們幾乎用盡了所有預先存在的數據,未經訓練的蛋白質結構和序列正在枯竭,RNA和DNA也是如此。
要想進一步訓練模型,發掘更多來源和模態的數據是必不可少的。Mahajan指出,理想情況下,這樣的數據應該滿足3個條件:
– 具有復雜的潛在分布
– 與重要的生理現象高度相關
– 適合大規模收集
在生物學領域,有很多數據可以滿足前兩個
原文鏈接:打破AlphaFold大模型局限,世界最大蛋白質相互作用數據集AlphaSeq橫空出世
聯系作者
文章來源:新智元
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...