檢索總結能力超博士后，首個大模型科研智能體PaperQA2開源了

AIGC動態1年前 (2024)發布機器之心

AIGC動態歡迎閱讀

原標題：檢索總結能力超博士后，首個大模型科研智能體PaperQA2開源了
關鍵字：報告,研究者,問題,論文,文獻
文章來源：機器之心
內容字數：0字

內容摘要：

機器之心報道
編輯：澤南、杜偉這是 AI 智能體在大部分科學研究中超越人類的第一個案例，或許會徹底改變人類與科學文獻互動的方式。最近一段時間，有關 AI 科學家的研究越來越多。大語言模型（LLM）有望幫助科學家檢索、綜合和總結文獻，提升人們的工作效率，但在研究工作中使用仍然有很多限制。
對于科研來說，事實性至關重要，而大模型會產生幻覺，有時會自信地陳述沒有任何現有來源或證據的信息。另外，科學需要極其注重細節，而大模型在面對具有挑戰性的推理問題時可能會忽略或誤用細節。
最后，目前科學文獻的檢索和推理基準尚不完善。AI 無法參考整篇文獻，而是局限于摘要、在固定語料庫上檢索，或者只是直接提供相關論文。這些基準不適合作為實際科學研究任務的性能代理，更重要的是，它們通常缺乏與人類表現的直接比較。因此，語言模型和智能體是否適合用于科學研究仍不清楚。
近日，來自 FutureHouse、羅切斯特大學等機構的研究者們嘗試構建一個更為強大的科研智能體，并對 AI 系統和人類在三個現實任務上的表現進行嚴格比較。這三個任務有關搜索整個文獻以回答問題；生成一篇有引用的、風格的科學主題文章；從論文中提取

原文鏈接：檢索總結能力超博士后，首個大模型科研智能體PaperQA2開源了