標簽:幻覺

大模型「幻覺」,看這一篇就夠了 | 哈工大華為出品

西風 發自 凹非寺量子位 | 公眾號 QbitAI大模型“幻覺”,終于有系統綜述了!一口氣49頁,詳細闡述了幻覺定義、分類、導致幻覺的原因,還有檢測幻覺、減輕幻覺...
閱讀原文

企業要做大模型落地?建議進來看看這個榜單

夕小瑤科技說 原創作者 | 賣萌醬機器幻覺問題,可能是未來相當長一段時間內懸浮在大模型領域上方的兩片烏云之一。遙記半年前,LeCun 就曾斷言:“單純根據概率...
閱讀原文

大模型幻覺排行榜GPT-4奪冠,英偉達科學家強力打假!Meta版ChatGPT一作發長文鳴冤

新智元報道編輯:編輯部【新智元導讀】Meta Galatica的一周年忌日快到了,LeCun和一作心里都很痛。比ChatGPT早誕生兩周,卻因幻覺被噴下架——ChatGPT的榮光,...
閱讀原文

LLM幻覺問題全梳理!哈工大團隊50頁綜述重磅發布

新智元報道編輯:拉燕【新智元導讀】最近,來自哈爾濱工業大學和華為的研究團隊發表了一篇長達50頁的綜述,細致地盤點了有關LLM幻覺問題你該知道的所有事。幻...
閱讀原文

比ChatGPT早發兩周,被噴下線的Galactica成了LeCun最大的意難平

機器之心報道編輯:小舟、大盤雞今天我們提到大型語言模型(LLM),第一個想到的就是 OpenAI 的 ChatGPT。一年來,ChatGPT 因其強大的性能,廣泛的應用前景而...
閱讀原文

大模型幻覺率排行:GPT-4 3%最低,谷歌Palm竟然高達27.2%

機器之心報道編輯:大盤雞排行榜一出,高下立見。人工智能發展進步神速,但問題頻出。OpenAI 新出的 ,后腳。幻覺一直是大模型的致命缺陷。由于數據集龐雜,...
閱讀原文

GPT-4作弊被抓!吉娃娃or松餅打亂順序就出錯,LeCun:警惕在訓練集上測試

夢晨 發自 凹非寺量子位 | 公眾號 QbitAIGPT-4解決網絡名梗“吉娃娃or藍莓松餅”,一度驚艷無數人。然鵝,現在它被指出“作弊”了!全用原題中出現的圖,只是打亂...
閱讀原文

連葫蘆娃都數不明白,解說英雄聯盟的GPT-4V面臨幻覺挑戰

??機器之心報道編輯:張倩、小舟讓大模型同時理解圖像和文字可能比想象中要難。在被稱為「AI 春晚」的 OpenAI 首屆開發者大會拉開帷幕后,很多人的朋友圈都被...
閱讀原文

九問中國大模型掌門人,萬字長文詳解大模型進度趨勢

來源:CSDN(ID:CSDNnews)作者:袁滾滾 責責:唐小引自ChatGPT 在去年 11 月底橫空出世,大模型的風刮了整一年。歷經了百模大戰、Llama 2 開源、GPTs 發...
閱讀原文

多模態物體幻覺下降23%!UNC斯坦福等推出通用修正器LURE:兼容任意LVLM,專攻三大幻覺成因

新智元報道編輯:LRS【新智元導讀】基于LVLM幻覺頻發的三個成因(物體共現、物體不確定性、物體位置),北卡教堂山、斯坦福、哥大、羅格斯等大學的研究人員提...
閱讀原文

解決多模態大模型幻覺問題的秘密武器:“啄木鳥”免重訓方法!哪里出問題啄哪里!

夕小瑤科技說 原創作者 | 付奶茶、王二狗最近多模態大模型的研究取得了巨大的進展。然而,這些模型在生成時存在著文本與圖像不一致的問題,這個問題就是一直...
閱讀原文

MetaAI提出全新驗證鏈框架,大模型通過“三省吾身”緩解幻覺現象

大數據文摘授權轉載自將門創投作者:seven_曾子曰:“吾日三省吾身”–出自《論語·學而》時至今日,生成幻覺(hallucination)仍然是大模型研究界中一個令人非常...
閱讀原文

多模態大模型幻覺降低30%!中科大等提出首個幻覺修正架構「Woodpecker」啄木鳥

新智元報道編輯:好困【新智元導讀】最近,來自中科大等機構的研究人員提出了首個多模態修正架構「啄木鳥」,可有效解決MLLM輸出幻覺的問題。視覺幻覺是常見...
閱讀原文

多模態LLM幻覺問題降低30%!業內首個“啄木鳥”免重訓方法誕生|中科大

豐色 發自 凹非寺量子位 | 公眾號 QbitAI還在用指令微調解決多模態大模型的“幻覺”問題嗎?比如下圖中模型將橙色柯基錯認為“紅狗”,還指出周圍還有幾條。現在...
閱讀原文

北大團隊:誘導大模型“幻覺”只需一串亂碼!大小羊駝全中招

kid 投稿自 凹非寺量子位 | 公眾號 QbitAI北大團隊最新研究發現:隨機token都能誘發大模型出現幻覺!比如喂給大模型(Vicuna-7B)一段“亂碼”,它就莫名其妙弄...
閱讀原文