入選ACL2024主會 | InstructProtein:利用知識指令對齊蛋白質語言與人類語言
AIGC動態歡迎閱讀
原標題:入選ACL2024主會 | InstructProtein:利用知識指令對齊蛋白質語言與人類語言
關鍵字:蛋白質,解讀,模型,語言,序列
文章來源:HyperAI超神經
內容字數:0字
內容摘要:
作者:梅菜
編輯:十九,李寶珠
浙江大學研究團隊提出InstructProtein,利用知識指令對齊蛋白質語言與人類語言,展示了將生物序列整合到大型語言模型的能力。作為細胞生存的基礎,蛋白質存在于包括人體在內的所有生物體中,是構成組織器官的支架和主要物質,在生命必不可少的化學反應中發揮著核心作用。
面對蛋白質結構的復雜多變,傳統實驗方法在解析蛋白質結構時既耗時又費力,蛋白質大語言模型 (PLMs) 應運而生——這些專業模型以氨基酸序列作為輸入,能預測蛋白質功能,甚至設計全新的蛋白質。然而,PLMs 雖然在理解氨基酸序列方面表現出色,但無法理解人類語言。
同樣地,當要求 ChatGPT 和 Claude-2 這類擅長處理自然語言的大語言模型 (LLMs),去描述蛋白質序列的功能或生成具有特定性質的蛋白質時,它們也力不從心。究其原因,目前的蛋白質-文本對數據集存在兩大缺陷:一是缺少明確的指令信號;二是數據注釋不平衡。總之,當前 LLMs 的研究中存在一個尚未解決的空白,即無法在人類語言和蛋白質語言之間快速轉換。
為了解決這類問題,浙江大學陳華鈞、張強團隊提出InstructProtein
原文鏈接:入選ACL2024主會 | InstructProtein:利用知識指令對齊蛋白質語言與人類語言
聯系作者
文章來源:HyperAI超神經
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...