OpenAI華人女科學(xué)家萬字詳解大模型「外在幻覺」

AIGC動(dòng)態(tài)1年前 (2024)發(fā)布夕小瑤科技說

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：OpenAI華人女科學(xué)家萬字詳解大模型「外在幻覺」
關(guān)鍵字：模型,幻覺,事實(shí)性,報(bào)告,問題
文章來源：夕小瑤科技說
內(nèi)容字?jǐn)?shù)：0字

內(nèi)容摘要：

夕小瑤科技說分享來源 | 量子位
大模型幻覺還分內(nèi)在、外在了——
OpenAI華人科學(xué)家翁荔最新Blog，提出LLM外在幻覺（extrinsic hallucination）。
有別于代指模型生成與現(xiàn)實(shí)不符、虛構(gòu)、不一致或者毫無意義的內(nèi)容，翁荔將LLM“幻覺”問題具體化為模型輸出內(nèi)容是虛構(gòu)的，并且不基于所提供的上下文或世界知識(shí)。
由此，幻覺有兩種類型：
上下文內(nèi)幻覺：模型輸出應(yīng)該與上下文中的源內(nèi)容一致（出現(xiàn)上下文內(nèi)幻覺時(shí)，輸出與源內(nèi)容不一致）。
外在幻覺：模型輸出應(yīng)該基于預(yù)訓(xùn)練數(shù)據(jù)集。然而，考慮到預(yù)訓(xùn)練數(shù)據(jù)集的規(guī)模，檢索并識(shí)別每次生成的沖突成本過高。如果將預(yù)訓(xùn)練數(shù)據(jù)集看作是世界知識(shí)的象征，那么本質(zhì)上是試圖確保模型輸出是事實(shí)性的并可以通過外部世界知識(shí)進(jìn)行驗(yàn)證。同樣重要的是，當(dāng)模型不了解某個(gè)事實(shí)時(shí)，它應(yīng)該明確表示不知道。
之前，翁荔還提出過Agent公式：Agent=大模型+記憶+主動(dòng)規(guī)劃+工具使用，被一些網(wǎng)友稱為是“看到的有關(guān)Agent的最好的文章”。
而這次關(guān)于大模型幻覺的這篇Blog，同樣“重工”，文章超長，足足24篇參考文獻(xiàn)：
翁荔重點(diǎn)關(guān)注外在幻覺，討論了三個(gè)問題：產(chǎn)生幻覺的原因

原文鏈接：OpenAI華人女科學(xué)家萬字詳解大模型「外在幻覺」

聯(lián)系作者

文章來源：夕小瑤科技說
作者微信：xixiaoyaoQAQ
作者簡介：專業(yè)、有趣、深度價(jià)值導(dǎo)向的科技媒體。聚集30萬AI工程師、研究員，覆蓋500多家海內(nèi)外機(jī)構(gòu)投資人，互聯(lián)網(wǎng)大廠中高管和AI公司創(chuàng)始人。一線作者來自清北、國內(nèi)外頂級AI實(shí)驗(yàn)室和大廠，兼?zhèn)涿翡J的行業(yè)嗅覺和洞察深度。商務(wù)合作：zym5189

閱讀原文