比人類便宜20倍！谷歌DeepMind推出「超人」AI系統

AIGC動態2年前 (2024)發布新智元

AIGC動態歡迎閱讀

原標題：比人類便宜20倍！谷歌DeepMind推出「超人」AI系統
關鍵字：模型,事實,人類,事實性,研究人員
文章來源：新智元
內容字數：4413字

內容摘要：

新智元報道編輯：alan
【新智元導讀】大模型的幻覺問題怎么解？谷歌DeepMind：用AI來做同行評審！事實核驗正確率超過人類，而且便宜20倍。AI的同行評審來了！
一直以來，大語言模型胡說八道（幻覺）的問題最讓人頭疼，而近日，來自谷歌DeepMind的一項研究引發網友熱議：
大模型的幻覺問題，好像被終結了？
論文地址：https://arxiv.org/pdf/2403.18802.pdf
項目地址：https://github.com/google-deepmind/long-form-factuality
在這篇工作中，研究人員介紹了一種名為 “搜索增強事實性評估器”（Search-Augmented Factuality Evaluator，SAFE）的方法。
對于LLM的長篇回答，SAFE使用其他的LLM，將答案文本分解為單個敘述，然后使用諸如RAG等方法，來確定每個敘述的準確性。
——簡單來說就是：AI答題，AI判卷，AI告訴AI你這里說的不對。
真正的「同行」評審。
另外，研究還發現，相比于人工標注和判斷事實準確性，使用AI不但便宜20倍，而且還更靠譜！
目前這個項目

原文鏈接：比人類便宜20倍！谷歌DeepMind推出「超人」AI系統