標簽:視覺

導航、采礦、建造,北大這個新智能體把《我的世界》玩透了

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

一塊顯卡理解一部電影,最新超長視頻理解大模型出爐!“大海撈針”準確率近95%,代碼已開源

允中 發自 凹非寺量子位 | 公眾號 QbitAI僅需1塊80G顯卡,大模型理解小時級超長視頻。 智源研究院聯合上海交通大學、中國人民大學、北京大學和北京郵電大學等...
閱讀原文

一張顯卡看遍天下電影!智源聯合高校開源Video-XL打破長視頻理解極限,95%準確率刷爆紀錄

新智元報道編輯:編輯部 HYZ 【新智元導讀】長視頻理解迎來新紀元!智源聯手國內多所頂尖高校,推出了超長視頻理解大模型Video-XL。僅用一張80G顯卡處理小時...
閱讀原文

百度又放大招!視覺生成模型 Hallo2 或將落地數字人等場景

作者 | 華衛 近日,百度聯合復旦大學等發布 Hallo2,一個可以生成長達數小時且分辨率為 4K 的人物動畫的視覺模型。Hallo2 目前已經在 GitHub 平臺開源,供全...
閱讀原文

開源模型突破原生多模態大模型性能瓶頸,上海AI Lab代季峰團隊出品

Mono-InternVL團隊 投稿量子位 | 公眾號 QbitAI原生多模態大模型性能瓶頸,迎來新突破! 上海AI Lab代季峰老師團隊,提出了全新的原生多模態大模型Mono-Inter...
閱讀原文

你和ChatGPT理解語言的方式一樣嗎?從表征對齊角度比較人工神經網絡與生物大腦

導語ChatGPT 理解語言的方式和人類一樣嗎?卷積神經網絡和人腦視覺系統的表征有哪些類似之處?不同信息處理系統之間的差異要如何定量刻畫?本文介紹了表征對...
閱讀原文

謝賽寧新作:表征學習有多重要?一個操作刷新SOTA,DiT訓練速度暴漲18倍

新智元報道編輯:喬楊 【新智元導讀】在NLP領域,研究者們已經充分認識并認可了表征學習的重要性,那么視覺領域的生成模型呢?最近,謝賽寧團隊發表的一篇研...
閱讀原文

DeepSeek新作Janus:解耦視覺編碼,引領多模態理解與生成統一新范式

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

搞定圖像+文本+視頻大一統!智源發布多模態世界模型Emu3:下一個token預測直通AGI

下一個token預測,通向多模態AGI。 OpenAI前首席科學家、聯合創始人Ilya Sutskever曾在多個場合表達觀點:只要能夠非常好的預測下一個token,就能幫助人類達...
閱讀原文

智源 Emu3 證明多模態模型新范式:只需基于下一個 token 預測

只需基于下一個 token 預測,智源 Emu3 重新定義多模態模型。OpenAI前首席科學家、聯合創始人Ilya Sutskever曾在多個場合表達觀點:只要能夠非常好的預測下一...
閱讀原文

Ilya預言成真,下一個token預測直達AGI!智源首發原生多模態世界模型Emu3,不用擴散

新智元報道編輯:編輯部 HYZ 【新智元導讀】最近,Ilya向黃仁勛描述「只要能預測下一個token,就能達到AGI」的視頻再次爆火全網,他的預言剛剛竟被證實?智源...
閱讀原文

PPT 滿屏文字? 救星來了!這款神器幫你一鍵生成專業插圖!

都說一圖勝千言,但你是否經常遇到這樣的場景:工作匯報、 PPT花了你大半天時間,上面的文字仍然堆積如山,網上又很難找到貼合你內容的圖片,而自己設計一個...
閱讀原文

Ilya觀點得證!僅靠預測下一個token統一圖像文本視頻,智源發布原生多模態世界模型Emu3

夢晨 發自 凹非寺量子位 | 公眾號 QbitAIOpenAI前首席科學家、聯合創始人Ilya Sutskever曾在多個場合表達觀點: 只要能夠非常好的預測下一個token,就能幫助...
閱讀原文

視頻、圖像、文本,只需基于下一個Token預測:智源Emu3發布,驗證多模態模型新范式

機器之心發布 機器之心編輯部OpenAI 前首席科學家、聯合創始人 Ilya Sutskever 曾在多個場合表達觀點:只要能夠非常好的預測下一個 token,就能幫助人類達到...
閱讀原文

OCR-Omni來了,字節&華師統一多模態文字理解與生成 | NeurIPS2024

TextHarmony團隊 投稿量子位 | 公眾號 QbitAI多模態生成新突破,字節&華師團隊打造TextHarmony,在單一模型架構中實現模態生成的統一,并入選NeurIPS 202...
閱讀原文
123420