首個(gè)!四大高校聯(lián)合推出藥物研發(fā)大語言模型Y-Mol,性能全面領(lǐng)先LLaMA2
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:首個(gè)!四大高校聯(lián)合推出藥物研發(fā)大語言模型Y-Mol,性能全面領(lǐng)先LLaMA2
關(guān)鍵字:藥物,模型,解讀,華為,數(shù)據(jù)
文章來源:HyperAI超神經(jīng)
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
作者:田小幺
編輯:十九
湖南大學(xué)、中南大學(xué)、湖南師范大學(xué)、湘潭大學(xué)的研究團(tuán)隊(duì)聯(lián)合提出了一種多尺度生物醫(yī)學(xué)知識指導(dǎo)的大語言模型 Y-Mol,它能夠在不同的文本語料庫和指令上進(jìn)行微調(diào),增強(qiáng)了模型在藥物研發(fā)方面的性能與潛力,這是大語言模型在藥物研發(fā)領(lǐng)域的一次全新突破。以 ChatGPT、ChatGLM 和 LLaMA 等為代表的大語言模型已成為人們探索未知世界的有力工具,這些擁有數(shù)十億參數(shù)的模型,通過大規(guī)模文本語料庫的精心訓(xùn)練,在生成文本和理解上下文方面展現(xiàn)出強(qiáng)大的能力。然而,這些模型大多在一般任務(wù)中表現(xiàn)出色,在某些特定領(lǐng)域,尤其是藥物研發(fā)領(lǐng)域,卻面臨著不小的挑戰(zhàn)。
與自然語言處理領(lǐng)域不同,藥物研發(fā)領(lǐng)域缺乏統(tǒng)一的標(biāo)準(zhǔn)范式,研發(fā)過程復(fù)雜且成本高昂。此外,它還涉及計(jì)算化學(xué)、結(jié)構(gòu)生物學(xué)和生物信息學(xué)等多個(gè)學(xué)科,相關(guān)數(shù)據(jù)難以獲取,且藥物相關(guān)實(shí)體之間的交互數(shù)據(jù)需要精細(xì)的領(lǐng)域知識才能進(jìn)行標(biāo)注,這些因素共同限制了大語言模型在藥物研發(fā)領(lǐng)域的應(yīng)用。
對此,湖南大學(xué)、中南大學(xué)、湖南師范大學(xué)、湘潭大學(xué)的研究團(tuán)隊(duì)聯(lián)合提出了一種多尺度生物醫(yī)學(xué)知識指導(dǎo)的大語言模型 Y-Mol。Y-Mol 是一種自回歸的序列到序列模型,
原文鏈接:首個(gè)!四大高校聯(lián)合推出藥物研發(fā)大語言模型Y-Mol,性能全面領(lǐng)先LLaMA2
聯(lián)系作者
文章來源:HyperAI超神經(jīng)
作者微信:
作者簡介: