全新生物學基準數據集LAB-Bench震撼開源!覆蓋8大任務,超2.4K選擇題
AIGC動態歡迎閱讀
原標題:全新生物學基準數據集LAB-Bench震撼開源!覆蓋8大任務,超2.4K選擇題
關鍵字:模型,任務,解讀,問題,能力
文章來源:HyperAI超神經
內容字數:0字
內容摘要:
lü作者:十九
編輯:十九,李寶珠
FutureHouse Inc. 的研究人員推出了 LAB-Bench 生物學基準測試數據集,用于評估 AI 系統在文獻檢索和推理、圖形解釋、表格解釋、數據庫訪問、撰寫協議、DNA 和蛋白質序列的理解和處理、克隆場景等實際生物學研究的表現。當被國外友人問候「How are you」時,你的第一反應是什么?
是不是經典的「I’m fine, Thank you. And you」?
其實,這種教科書式問答不僅存在于我們的英語學習交流中,也存在于大語言模型的訓練和測試中。
如今,將大語言模型 (LLMs) 和 LLM 增強系統用于生物學、海洋科學、材料科學等領域的研究,進而提高科研效率、成果產出,已成為很多科學家關注的重點方向。比如,浙江大學團隊曾在海洋領域推出大語言模型 OceanGPT,微軟曾在生物醫藥領域開發大語言模型 BioGPT,上海交通大學曾在地球科學領域提出大語言模型 K2。
值得注意的是,隨著 LLMs 在科研領域的日益普及,建立一套高質量、專業性強的評估基準變得至關重要。
然而,目前許多基準測試 (benchmarks exist) 聚
原文鏈接:全新生物學基準數據集LAB-Bench震撼開源!覆蓋8大任務,超2.4K選擇題
聯系作者
文章來源:HyperAI超神經
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...