AIGC動態歡迎閱讀
原標題:國產多模態大模型開源!無條件免費商用,性能超Claude 3 Sonnet
關鍵字:騰訊,模型,圖像,場景,圖表
文章來源:量子位
內容字數:2651字
內容摘要:
簡曈發自 凹非寺量子位 | 公眾號 QbitAI又一個國產多模態大模型開源!
XVERSE-V,來自元象,還是同樣的無條件免費商用。
此前元象曾率先發布國內規模最大的開源大模型,如今開源家族系列又多了一個。
最新的多模態大模型支持任意寬高比圖像輸入,在主流評測中保持著效果領先——
在多項權威多模態評測中,XVERSE-V超過零一萬物Yi-VL-34B、面壁智能OmniLMM-12B及深度求索DeepSeek-VL-7B等開源模型。
在綜合能力測評MMBench中超過了谷歌GeminiProVision、阿里Qwen-VL-Plus和Claude-3V Sonnet等知名閉源模型。
支持任意長寬比圖像輸入傳統的多模態模型的圖像表示只有整體,XVERSE-V 采用了融合整體和局部的策略,支持輸入任意寬高比的圖像。
兼顧全局的概覽信息和局部的細節信息,能夠識別和分析圖像中的細微特征,看的更清楚,理解的更準確
這樣的處理方式使模型可以應用于廣泛的領域,包括全景圖識別、衛星圖像、古文物掃描分析等。
△示例- 高清全景圖識別△示例-圖片細節文字識別除了基本能力表現不錯,也能輕松應對各種不同的實際應
原文鏈接:國產多模態大模型開源!無條件免費商用,性能超Claude 3 Sonnet
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...