AIGC動態歡迎閱讀
原標題:最強開源多模態生成模型MM-Interleaved:首創特征同步器
關鍵字:圖像,模型,任務,框架,圖文
文章來源:機器之心
內容字數:5655字
內容摘要:
機器之心專欄
機器之心編輯部過去幾個月中,隨著 GPT-4V、DALL-E 3、Gemini 等重磅工作的相繼推出,「AGI 的下一步」—— 多模態生成大模型迅速成為全球學者矚目的焦點。
想象一下,AI 不僅會,還長了「眼睛」,能看懂圖片,甚至還會通過畫畫來表達自己!這意味著,你可以和它們談天說地,分享圖片或視頻,它們也同樣能用圖文并茂的方式回應你。
最近,上海人工智能實驗室聯合香港中文大學多媒體實驗室(MMLab)、清華大學、商湯科技、多倫多大學等多家高校、機構,共同發布了一個多才多藝的最強開源多模態生成模型 MM-Interleaved,借助全新提出的多模態特征同步器刷新多項任務 SOTA。它擁有對高分辨率圖像細節和微妙語義的精準理解能力,支持任意穿插的圖文輸入和輸出,帶來了多模態生成大模型的嶄新突破。論文地址:https://arxiv.org/pdf/2401.10208.pdf
項目地址:https://github.com/OpenGVLab/MM-Interleaved
模型地址:https://huggingface.co/OpenGVLab/MM-Interlea
原文鏈接:最強開源多模態生成模型MM-Interleaved:首創特征同步器
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...