語(yǔ)義熵識(shí)破LLM幻覺(jué)!牛津大學(xué)新研究登Nature

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:語(yǔ)義熵識(shí)破LLM幻覺(jué)!牛津大學(xué)新研究登Nature
關(guān)鍵字:語(yǔ)義,答案,問(wèn)題,模型,不確定性
文章來(lái)源:新智元
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
新智元報(bào)道編輯:alan
【新智元導(dǎo)讀】近日,來(lái)自牛津大學(xué)的研究人員推出了利用語(yǔ)義熵來(lái)檢測(cè)LLM幻覺(jué)的新方法。作為克服混淆的策略,語(yǔ)義熵建立在不確定性估計(jì)的概率工具之上,可以直接應(yīng)用于基礎(chǔ)模型,無(wú)需對(duì)架構(gòu)進(jìn)行任何修改。時(shí)至今日,大語(yǔ)言模型胡編亂造的情況仍屢見(jiàn)不鮮。
不知大家面對(duì)LLM的一本正經(jīng)胡說(shuō)八道,是輕皺眉頭,還是一笑而過(guò)?
俗話說(shuō),大風(fēng)起兮云飛揚(yáng),安得猛士兮走四方。LLM幻覺(jué)任何時(shí)候都要除掉,不除不行。
試想,當(dāng)你搜索一個(gè)簡(jiǎn)單語(yǔ)法時(shí),網(wǎng)頁(yè)上排名前幾的都是由大模型生成的錯(cuò)誤答案,測(cè)過(guò)之后才發(fā)覺(jué)浪費(fèi)了生命。
如果LLM涉及了醫(yī)學(xué)、法律等專業(yè)領(lǐng)域,幻覺(jué)將造成嚴(yán)重的后果,所以相關(guān)的研究也從未停止。
近日,來(lái)自牛津大學(xué)的研究人員在Nature上發(fā)表了利用語(yǔ)義熵來(lái)檢測(cè)LLM幻覺(jué)的新方法。
論文地址:https://www.nature.com/articles/s41586-024-07421-0
牛津大學(xué)計(jì)算機(jī)科學(xué)家Sebastian Farquhar等人,通過(guò)設(shè)計(jì)基于LLM確定的語(yǔ)義熵(相似性),來(lái)度量大模型答案中語(yǔ)義層面的不確定性。
做法是讓第一個(gè)LLM針對(duì)同一問(wèn)題多次產(chǎn)生答案,并由
原文鏈接:語(yǔ)義熵識(shí)破LLM幻覺(jué)!牛津大學(xué)新研究登Nature
聯(lián)系作者
文章來(lái)源:新智元
作者微信:AI_era
作者簡(jiǎn)介:智能+中國(guó)主平臺(tái),致力于推動(dòng)中國(guó)從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國(guó)新智能時(shí)代。

粵公網(wǎng)安備 44011502001135號(hào)