全新生物學(xué)基準數(shù)據(jù)集LAB-Bench震撼開源!覆蓋8大任務(wù),超2.4K選擇題
AIGC動態(tài)歡迎閱讀
原標題:全新生物學(xué)基準數(shù)據(jù)集LAB-Bench震撼開源!覆蓋8大任務(wù),超2.4K選擇題
關(guān)鍵字:模型,任務(wù),解讀,問題,能力
文章來源:HyperAI超神經(jīng)
內(nèi)容字數(shù):0字
內(nèi)容摘要:
lü作者:十九
編輯:十九,李寶珠
FutureHouse Inc. 的研究人員推出了 LAB-Bench 生物學(xué)基準測試數(shù)據(jù)集,用于評估 AI 系統(tǒng)在文獻檢索和推理、圖形解釋、表格解釋、數(shù)據(jù)庫訪問、撰寫協(xié)議、DNA 和蛋白質(zhì)序列的理解和處理、克隆場景等實際生物學(xué)研究的表現(xiàn)。當(dāng)被國外友人問候「How are you」時,你的第一反應(yīng)是什么?
是不是經(jīng)典的「I’m fine, Thank you. And you」?
其實,這種教科書式問答不僅存在于我們的英語學(xué)習(xí)交流中,也存在于大語言模型的訓(xùn)練和測試中。
如今,將大語言模型 (LLMs) 和 LLM 增強系統(tǒng)用于生物學(xué)、海洋科學(xué)、材料科學(xué)等領(lǐng)域的研究,進而提高科研效率、成果產(chǎn)出,已成為很多科學(xué)家關(guān)注的重點方向。比如,浙江大學(xué)團隊曾在海洋領(lǐng)域推出大語言模型 OceanGPT,微軟曾在生物醫(yī)藥領(lǐng)域開發(fā)大語言模型 BioGPT,上海交通大學(xué)曾在地球科學(xué)領(lǐng)域提出大語言模型 K2。
值得注意的是,隨著 LLMs 在科研領(lǐng)域的日益普及,建立一套高質(zhì)量、專業(yè)性強的評估基準變得至關(guān)重要。
然而,目前許多基準測試 (benchmarks exist) 聚
原文鏈接:全新生物學(xué)基準數(shù)據(jù)集LAB-Bench震撼開源!覆蓋8大任務(wù),超2.4K選擇題
聯(lián)系作者
文章來源:HyperAI超神經(jīng)
作者微信:
作者簡介: