AIGC動態歡迎閱讀
原標題:智源獨家丨謝賽寧:AI是否需要更強的視覺基礎來實現理解和意義?
關鍵字:視覺,模型,語言,報告,系統
文章來源:人工智能學家
內容字數:0字
內容摘要:
來源:智源社區
6 月 15 日,萬眾矚目的智源大會「多模態大模型」論壇轟動舉行。紐約大學助理教授謝賽寧從哲學的角度出發,針對大語言時代的視覺表征研究娓娓道來。從探索多模態大型語言模型的視覺缺陷、基于視覺搜索引導的多模態大模型、真實世界中的虛擬智能落地等方面介紹了團隊的最新工作。通過這些工作,讀者們可以窺見MLLM 的未來風向。
人工智能是否需要感知基礎來實現理解?實際上,早在 1990 年,Stevan Harnad 就討論了符號基礎的問題。那時,深度學習還沒誕生。人們認為,只有當我們為人類語言或計算機代碼賦予某種感知基礎,這些符號才有意義。AI 要阻止出現「語義鴻溝」:通常人們在判別圖像的相似性時并非建立在圖像底層視覺特征的相似上,而是建立在對圖像所描述的對象或的語義理解的基礎上。
在更早的 13世紀,意大利的神學家托馬斯·阿奎納曾提出「There’s nothing in mind that wasn’t first in the senses」的觀點,即先有感知才有心智。此外,17 世紀的哲學家 Diderot、Condilac 等 Sensim 學派哲學家也認為:沒有感知
原文鏈接:智源獨家丨謝賽寧:AI是否需要更強的視覺基礎來實現理解和意義?
聯系作者
文章來源:人工智能學家
作者微信:AItists
作者簡介:致力成為權威的人工智能科技媒體和前沿科技研究機構
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...