國產多模態大模型開源！無條件免費商用，性能超Claude 3 Sonnet

AIGC動態2年前 (2024)發布量子位

AIGC動態歡迎閱讀

原標題：國產多模態大模型開源！無條件免費商用，性能超Claude 3 Sonnet
關鍵字：騰訊,模型,圖像,場景,圖表
文章來源：量子位
內容字數：2651字

內容摘要：

簡曈發自凹非寺量子位 | 公眾號 QbitAI又一個國產多模態大模型開源！
XVERSE-V，來自元象，還是同樣的無條件免費商用。
此前元象曾率先發布國內規模最大的開源大模型，如今開源家族系列又多了一個。
最新的多模態大模型支持任意寬高比圖像輸入，在主流評測中保持著效果領先——
在多項權威多模態評測中，XVERSE-V超過零一萬物Yi-VL-34B、面壁智能OmniLMM-12B及深度求索DeepSeek-VL-7B等開源模型。
在綜合能力測評MMBench中超過了谷歌GeminiProVision、阿里Qwen-VL-Plus和Claude-3V Sonnet等知名閉源模型。
支持任意長寬比圖像輸入傳統的多模態模型的圖像表示只有整體，XVERSE-V 采用了融合整體和局部的策略，支持輸入任意寬高比的圖像。
兼顧全局的概覽信息和局部的細節信息，能夠識別和分析圖像中的細微特征，看的更清楚，理解的更準確
這樣的處理方式使模型可以應用于廣泛的領域，包括全景圖識別、衛星圖像、古文物掃描分析等。
△示例- 高清全景圖識別△示例-圖片細節文字識別除了基本能力表現不錯，也能輕松應對各種不同的實際應

原文鏈接：國產多模態大模型開源！無條件免費商用，性能超Claude 3 Sonnet