AIGC動態歡迎閱讀
原標題:模擬5億年的進化信息,首個同時推理蛋白質序列、結構和功能的生物學大模型
關鍵字:蛋白質,序列,報告,結構,功能
文章來源:人工智能學家
內容字數:0字
內容摘要:
來源:ScienceAI
編輯:蘿卜皮
在三十億年的自然進化歷程中,現存蛋白質的形態得以形成,經歷了漫長的自然篩選過程。進化如同在地質時間尺度上進行的平行實驗,通過隨機突變和選擇機制,依據蛋白質的序列、結構與功能進行篩選。
在這里,EvolutionaryScale 的研究人員展示了在進化產生的標記上訓練的語言模型可以充當進化模擬器,用于生成不同于已知蛋白質序列的功能性蛋白質。
研究人員提出了 ESM3,這是一種前沿的多模態生成語言模型,可推理蛋白質的序列、結構和功能。ESM3 可以結合其模態來遵循復雜的提示,并且對生物學對齊(biological alignment)高度敏感。
研究人員使用 ESM3 生成熒光蛋白。其中一種功能上明亮的熒光蛋白,與已知的熒光蛋白的序列差異很大(58% 同源性)。
該研究的預印版文章「Simulating 500 million years of evolution with a language model」近期將發布在 bioRxiv 預印平臺。
自然進化是如何在超過三十億年的時間里,雕琢出當前自然界中蛋白質的多樣性的呢?
這一過程涉及無數隨機突變
原文鏈接:模擬5億年的進化信息,首個同時推理蛋白質序列、結構和功能的生物學大模型
聯系作者
文章來源:人工智能學家
作者微信:AItists
作者簡介:致力成為權威的人工智能科技媒體和前沿科技研究機構
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...