AIGC動態歡迎閱讀
原標題:零一萬物Yi-VL多模態大模型開源,MMMU、CMMMU兩大權威榜單領先
關鍵字:模型,語言,圖像,能力,文本
文章來源:機器之心
內容字數:3894字
內容摘要:
機器之心發布
機器之心編輯部1 月 22 日,零一萬物 Yi 系列模型家族迎來新成員:Yi Vision Language(Yi-VL)多模態語言大模型正式面向全球開源。據悉,Yi-VL 模型基于 Yi 語言模型開發,包括 Yi-VL-34B 和 Yi-VL-6B 兩個版本。
Yi-VL 模型開源地址:
https://huggingface.co/01-ai
https://www.modelscope.cn/organization/01ai
憑借卓越的圖文理解和對話生成能力,Yi-VL 模型在英文數據集 MMMU 和中文數據集 CMMMU 上取得了領先成績,展示了在復雜跨學科任務上的強大實力。
MMMU(全名 Massive Multi-discipline Multi-modal Understanding & Reasoning 大規模多學科多模態理解和推理)數據集包含了 11500 個來自六大核心學科(藝術與設計、商業、科學、健康與醫學、人文與社會科學以及技術與工程)的問題,涉及高度異構圖像類型和交織文本圖像信息,對模型的高級知覺和推理能力提出了極高要求。在該測試集上,Yi
原文鏈接:零一萬物Yi-VL多模態大模型開源,MMMU、CMMMU兩大權威榜單領先
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...