當(dāng)視覺大模型陷入認(rèn)知失調(diào),馬里蘭大學(xué)構(gòu)建了一個幻覺自動生成框架
AIGC動態(tài)歡迎閱讀
原標(biāo)題:當(dāng)視覺大模型陷入認(rèn)知失調(diào),馬里蘭大學(xué)構(gòu)建了一個幻覺自動生成框架
關(guān)鍵字:物體,模型,幻覺,解讀,圖像
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進(jìn)了學(xué)術(shù)交流與傳播。如果您有優(yōu)秀的工作想要分享,歡迎投稿或者聯(lián)系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文的共同第一作者是馬里蘭大學(xué)電子計算機(jī)工程系的博士生吳曦旸(https://wuxiyang1996.github.io/)和計算機(jī)科學(xué)系的關(guān)天瑞(https://tianruiguan.phd/)。吳曦旸的研究方向主要涵蓋強(qiáng)化學(xué)習(xí)、自動駕駛,以及大語言模型在機(jī)器人導(dǎo)航和計算機(jī)視覺中的應(yīng)用。關(guān)天瑞的研究則聚焦于計算機(jī)視覺和視覺語言模型在機(jī)器人、自動駕駛等領(lǐng)域的應(yīng)用。本文的指導(dǎo)老師為李典奇,周天翼教授 (https://tianyizhou.github.io/)和 Dinesh Manocha 教授 (https://www.cs.umd.edu/people/dmanocha)。
想象一下,有一天你在沙漠中看到一個雪人,或者在雪地里發(fā)現(xiàn)一棵棕櫚樹。面對這些
原文鏈接:當(dāng)視覺大模型陷入認(rèn)知失調(diào),馬里蘭大學(xué)構(gòu)建了一個幻覺自動生成框架
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:
作者簡介: