比人類便宜20倍!谷歌DeepMind推出「超人」AI系統(tǒng)
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:比人類便宜20倍!谷歌DeepMind推出「超人」AI系統(tǒng)
關(guān)鍵字:模型,事實(shí),人類,事實(shí)性,研究人員
文章來源:新智元
內(nèi)容字?jǐn)?shù):4413字
內(nèi)容摘要:
新智元報(bào)道編輯:alan
【新智元導(dǎo)讀】大模型的幻覺問題怎么解?谷歌DeepMind:用AI來做同行評(píng)審!事實(shí)核驗(yàn)正確率超過人類,而且便宜20倍。AI的同行評(píng)審來了!
一直以來,大語言模型胡說八道(幻覺)的問題最讓人頭疼,而近日,來自谷歌DeepMind的一項(xiàng)研究引發(fā)網(wǎng)友熱議:
大模型的幻覺問題,好像被終結(jié)了?
論文地址:https://arxiv.org/pdf/2403.18802.pdf
項(xiàng)目地址:https://github.com/google-deepmind/long-form-factuality
在這篇工作中,研究人員介紹了一種名為 “搜索增強(qiáng)事實(shí)性評(píng)估器”(Search-Augmented Factuality Evaluator,SAFE)的方法。
對(duì)于LLM的長篇回答,SAFE使用其他的LLM,將答案文本分解為單個(gè)敘述,然后使用諸如RAG等方法,來確定每個(gè)敘述的準(zhǔn)確性。
——簡(jiǎn)單來說就是:AI答題,AI判卷,AI告訴AI你這里說的不對(duì)。
真正的「同行」評(píng)審。
另外,研究還發(fā)現(xiàn),相比于人工標(biāo)注和判斷事實(shí)準(zhǔn)確性,使用AI不但便宜20倍,而且還更靠譜!
目前這個(gè)項(xiàng)目
原文鏈接:比人類便宜20倍!谷歌DeepMind推出「超人」AI系統(tǒng)
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡(jiǎn)介:智能+中國主平臺(tái),致力于推動(dòng)中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國新智能時(shí)代。