AIGC動態歡迎閱讀
原標題:開源模型「幻覺」更嚴重,這是三元組粒度的幻覺檢測套件
文章來源:機器之心
內容字數:8855字
內容摘要:機器之心專欄機器之心編輯部BSChecker:細粒度大模型幻覺檢測工具與基準測試排行榜大模型長期以來一直存在一個致命的問題,即生成幻覺。由于數據集的復雜性,難免會包含過時和錯誤的信息,這使得輸出質量面臨著極大的挑戰。過多的重復信息還可能導致大型模型產生偏見,這也算是一種形式的幻覺。如何檢測和有效緩解大模型的生成幻覺問題一直是學術界的熱門課題。近日,亞馬遜上海人工智能研究院推出細粒度大模型幻覺檢測工具 BSChecker,包含如下重要特性:細粒度幻覺檢測框架,對大模型輸出文本進行三元組粒度的幻覺檢測。幻覺檢測基準測試集,包含三種任務場景,滿足用戶的不同需求。兩個基準測試排行榜,目前涵蓋15個主流大模型的幻覺檢測結果。另外,BSChecker的作者們在Gemini推出后也很快做了自動檢測的幻覺測試。幻覺檢測框架示意圖項目地址:https://github.com/amazon-science/…
原文鏈接:點此閱讀原文:開源模型「幻覺」更嚴重,這是三元組粒度的幻覺檢測套件
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...