<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        4000萬蛋白結構訓練,西湖大學開發基于結構詞表的蛋白質通用大模型,已開源

        AIGC動態1年前 (2024)發布 機器之心
        493 0 0

        4000萬蛋白結構訓練,西湖大學開發基于結構詞表的蛋白質通用大模型,已開源

        AIGC動態歡迎閱讀

        原標題:4000萬蛋白結構訓練,西湖大學開發基于結構詞表蛋白質通用大模型,已開源
        關鍵字:結構,蛋白質,模型,詞表,序列
        文章來源:機器之心
        內容字數:5725字

        內容摘要:


        將ScienceAI設為星標
        第一時間掌握
        新鮮的AI for Science資訊編輯 |ScienceAI
        蛋白質結構相比于序列往往被認為更加具有信息量,因為其直接決定了蛋白質的功能。而隨著AlphaFold2帶來的巨大突破,大量的預測結構被發布出來供人研究使用。如何利用這些蛋白質結構來訓練強大且通用的表征模型是一個值得研究的方向。
        西湖大學的研究人員利用Foldseek來處理蛋白質結構,將其編碼成一維的離散token,并與傳統的氨基酸進行結合,形成了結構感知詞表(Structure-aware Vocabulary),以此將結構信息嵌入到模型輸入中,增強模型的表征能力。
        在預訓練上,論文使用了目前最多的蛋白質結構(identity過濾后4000萬),在64張A100上訓練了3個月,最終開源了具備650M參數量的模型SaProt(同時包括了35M的版本)。實驗結果表明SaProt各種蛋白質任務上都要好于之前的序列和結構模型。
        研究《SaProt: Protein Language Modeling with Structure-aware Vocabulary》的預印版本,于2024


        原文鏈接:4000萬蛋白結構訓練,西湖大學開發基于結構詞表的蛋白質通用大模型,已開源

        聯系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲一级二级三级不卡| 亚洲国产一区视频| 黄色永久免费网站| 在线观看特色大片免费视频 | 免费a级毛片无码av| 国产亚洲精品激情都市| 337p日本欧洲亚洲大胆精品555588 | 中文免费观看视频网站| 亚洲精品无码成人片在线观看| 色欲aⅴ亚洲情无码AV| 中文字幕无线码免费人妻| 亚洲免费人成在线视频观看| 日本免费网址大全在线观看| 在线精品亚洲一区二区三区| 亚洲国产日韩女人aaaaaa毛片在线| 亚洲欧洲国产综合AV无码久久 | 久章草在线精品视频免费观看| 国产免费午夜a无码v视频| 91亚洲导航深夜福利| 久久久久久精品成人免费图片| 狠狠色伊人亚洲综合网站色| 中文字幕日本人妻久久久免费| 亚洲国产精品成人一区| 亚洲综合精品第一页| 免费观看无遮挡www的小视频| 亚洲AV无码一区二区三区人 | 日韩欧美一区二区三区免费观看| 中文字幕亚洲日韩无线码| 免费在线观看一级片| 久久综合久久综合亚洲| 免费人成激情视频| 久久国产精品免费观看| 亚洲av午夜电影在线观看 | 成人国产精品免费视频| 亚洲婷婷在线视频| 91制片厂制作传媒免费版樱花| 中文字幕专区在线亚洲| 亚洲一级毛片免费看| 四虎成人精品国产永久免费无码 | 国产亚洲日韩在线三区| 久久久www成人免费毛片|