AIGC動態歡迎閱讀
原標題:Transformer大殺器進入蛋白質組學,一文梳理LLM如何助力生命科學領域大變革
關鍵字:蛋白質,序列,模型,結構,語言
文章來源:新智元
內容字數:8713字
內容摘要:
新智元報道編輯:庸庸 喬楊
【新智元導讀】科學家們把Transformer模型應用到蛋白質序列數據中,試圖在蛋白質組學領域復制LLM的成功。本篇文章能夠帶你了解蛋白質語言模型(pLM)的起源、發展,以及那些尚待解決的問題。「大語言模型」不僅可以用于人類語言,也可以用于蛋白質的「語言」,而且兩者之間有很多相似之處。
過去幾年,Transformer架構帶來了大模型在文本和圖像方面的驚人進展,當應用于生命科學領域時,也取得了影響深遠的的成果。
大語言模型是如何應用于蛋白質組學的?科學家們又有哪些發現?
蛋白質是一種「語言」自然語言由單詞、短語、句子等不同層次的模塊組成,蛋白質的「語言」也是類似的情況。
蛋白質由基序(motif)和結構域(domain)組成,類似于蛋白質世界的「單詞」和「短語」。
基序和結構域的各種組合與重復構建了更加復雜的結構,從而決定蛋白質的生物功能,類似于人類語言中句子傳達的含義。
除了結構層次的相似性,蛋白質和人類語言還有另一個關鍵的相似點——「信息完整性」。
這意味著從信息論的角度來看,蛋白質的信息(例如其結構)完全包含在其序列中。
雖然由于環境和與其他分子的相
原文鏈接:Transformer大殺器進入蛋白質組學,一文梳理LLM如何助力生命科學領域大變革
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...