中文性能反超VLM頂流GPT-4V，阿里Qwen-VL超大杯限免！看圖秒寫編程視覺難題一眼辨出

AIGC動態2年前 (2024)發布新智元

AIGC動態歡迎閱讀

原標題：中文性能反超VLM頂流GPT-4V，阿里Qwen-VL超大杯限免！看圖秒寫編程視覺難題一眼辨出
關鍵字：解讀,模型,報告,視覺,能力
文章來源：新智元
內容字數：9133字

內容摘要：

新智元報道編輯：編輯部
【新智元導讀】多模態大模型將是AI下一個爆點。最近，通義千問VLM模型換新升級，超大杯性能堪比GPT-4V。最最重要的是，還能限時免費用。最近，通義千問實火。
前段時間被網友玩瘋的全民舞王，讓「AI科目三」頻頻登上熱搜。
讓甄嬛、、馬斯克、貓主子和兵馬俑能跳舞那款AI，就藏在通義千問APP背后。
?
來源：深夜來點薯片
來源：深夜來點薯片
最強國產視覺語言模型了解一下就在這幾天，通義千問團隊又對多模態大模型下手了——
再一次升級通義千問視覺語言模型Qwen-VL，繼Plus版本之后，又推出Max版本。
Qwen-VL是阿里在2023年8月推出的具備圖文理解能力的大模型，基于通義千問語言模型開發。升級后的Qwen-VL視覺水平大幅提升，對很多圖片的理解水平接近人類。
并且，還能夠支持百萬像素以上的高清分辨率圖，以及各種極端長寬比的圖片。
升級版模型限時免費，在通義千問官網和APP都可體驗，API也可免費調用。
評測結果顯示，Qwen-VL的升級版本在MMMU、MathVista等任務上遠超業界所有開源模型，在文檔分析（DocVQA）、中文圖像相關（MM-Be

原文鏈接：中文性能反超VLM頂流GPT-4V，阿里Qwen-VL超大杯限免！看圖秒寫編程視覺難題一眼辨出