AIGC動態歡迎閱讀
原標題:計算機視覺GPT時刻!UC伯克利三巨頭祭出首個純CV大模型,推理驚現AGI火花
文章來源:新智元
內容字數:16210字
內容摘要:新智元報道編輯:編輯部【新智元導讀】UC伯克利的CV三巨頭推出首個無自然語言的純視覺大模型,第一次證明純CV模型也是可擴展的。更令人震驚的是,LVM竟然也能做對圖形推理題,AGI火花再次出現了?計算機視覺的GPT時刻,來了!最近,來自UC伯克利的計算機視覺「三巨頭」聯手推出了第一個無自然語言的純視覺大模型(Large Vision Models),并且第一次證明了純視覺模型本身也是可擴展的(scalability)。除此之外,研究人員還利用超過420B token的數據集讓模型可以通過上下文學習來理解并執行下游任務,并且統一了圖片/視頻、有監督/無監督、合成/真實、2D/3D/4D等幾乎所有的數據形式。論文地址:https://arxiv.org/abs/2312.00785值得一提的是,讓LVM做非語言類智商測試(Raven’s Progressive Matrices )中常見的非語言…
原文鏈接:點此閱讀原文:計算機視覺GPT時刻!UC伯克利三巨頭祭出首個純CV大模型,推理驚現AGI火花
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...