首個(gè)！四大高校聯(lián)合推出藥物研發(fā)大語言模型Y-Mol，性能全面領(lǐng)先LLaMA2

AIGC動(dòng)態(tài)11個(gè)月前發(fā)布 HyperAI超神經(jīng)

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：首個(gè)！四大高校聯(lián)合推出藥物研發(fā)大語言模型Y-Mol，性能全面領(lǐng)先LLaMA2
關(guān)鍵字：藥物,模型,解讀,華為,數(shù)據(jù)
文章來源：HyperAI超神經(jīng)
內(nèi)容字?jǐn)?shù)：0字

內(nèi)容摘要：

作者：田小幺
編輯：十九
湖南大學(xué)、中南大學(xué)、湖南師范大學(xué)、湘潭大學(xué)的研究團(tuán)隊(duì)聯(lián)合提出了一種多尺度生物醫(yī)學(xué)知識指導(dǎo)的大語言模型 Y-Mol，它能夠在不同的文本語料庫和指令上進(jìn)行微調(diào)，增強(qiáng)了模型在藥物研發(fā)方面的性能與潛力，這是大語言模型在藥物研發(fā)領(lǐng)域的一次全新突破。以 ChatGPT、ChatGLM 和 LLaMA 等為代表的大語言模型已成為人們探索未知世界的有力工具，這些擁有數(shù)十億參數(shù)的模型，通過大規(guī)模文本語料庫的精心訓(xùn)練，在生成文本和理解上下文方面展現(xiàn)出強(qiáng)大的能力。然而，這些模型大多在一般任務(wù)中表現(xiàn)出色，在某些特定領(lǐng)域，尤其是藥物研發(fā)領(lǐng)域，卻面臨著不小的挑戰(zhàn)。
與自然語言處理領(lǐng)域不同，藥物研發(fā)領(lǐng)域缺乏統(tǒng)一的標(biāo)準(zhǔn)范式，研發(fā)過程復(fù)雜且成本高昂。此外，它還涉及計(jì)算化學(xué)、結(jié)構(gòu)生物學(xué)和生物信息學(xué)等多個(gè)學(xué)科，相關(guān)數(shù)據(jù)難以獲取，且藥物相關(guān)實(shí)體之間的交互數(shù)據(jù)需要精細(xì)的領(lǐng)域知識才能進(jìn)行標(biāo)注，這些因素共同限制了大語言模型在藥物研發(fā)領(lǐng)域的應(yīng)用。
對此，湖南大學(xué)、中南大學(xué)、湖南師范大學(xué)、湘潭大學(xué)的研究團(tuán)隊(duì)聯(lián)合提出了一種多尺度生物醫(yī)學(xué)知識指導(dǎo)的大語言模型 Y-Mol。Y-Mol 是一種自回歸的序列到序列模型，

原文鏈接：首個(gè)！四大高校聯(lián)合推出藥物研發(fā)大語言模型Y-Mol，性能全面領(lǐng)先LLaMA2