零一萬物Yi-VL多模態(tài)大模型開源，MMMU、CMMMU兩大權威榜單領先

AIGC動態(tài)2年前 (2024)發(fā)布機器之心

AIGC動態(tài)歡迎閱讀

原標題：零一萬物Yi-VL多模態(tài)大模型開源，MMMU、CMMMU兩大權威榜單領先
關鍵字：模型,語言,圖像,能力,文本
文章來源：機器之心
內(nèi)容字數(shù)：3894字

內(nèi)容摘要：

機器之心發(fā)布
機器之心編輯部1 月 22 日，零一萬物 Yi 系列模型家族迎來新成員：Yi Vision Language（Yi-VL）多模態(tài)語言大模型正式面向全球開源。據(jù)悉，Yi-VL 模型基于 Yi 語言模型開發(fā)，包括 Yi-VL-34B 和 Yi-VL-6B 兩個版本。
Yi-VL 模型開源地址：
https://huggingface.co/01-ai
https://www.modelscope.cn/organization/01ai
憑借卓越的圖文理解和對話生成能力，Yi-VL 模型在英文數(shù)據(jù)集 MMMU 和中文數(shù)據(jù)集 CMMMU 上取得了領先成績，展示了在復雜跨學科任務上的強大實力。
MMMU（全名 Massive Multi-discipline Multi-modal Understanding & Reasoning 大規(guī)模多學科多模態(tài)理解和推理）數(shù)據(jù)集包含了 11500 個來自六大核心學科（藝術與設計、商業(yè)、科學、健康與醫(yī)學、人文與社會科學以及技術與工程）的問題，涉及高度異構(gòu)圖像類型和交織文本圖像信息，對模型的高級知覺和推理能力提出了極高要求。在該測試集上，Yi

原文鏈接：零一萬物Yi-VL多模態(tài)大模型開源，MMMU、CMMMU兩大權威榜單領先