AIGC動態歡迎閱讀
原標題:中文性能反超VLM頂流GPT-4V,阿里Qwen-VL超大杯限免!看圖秒寫編程視覺難題一眼辨出
關鍵字:解讀,模型,報告,視覺,能力
文章來源:新智元
內容字數:9133字
內容摘要:
新智元報道編輯:編輯部
【新智元導讀】多模態大模型將是AI下一個爆點。最近,通義千問VLM模型換新升級,超大杯性能堪比GPT-4V。最最重要的是,還能限時免費用。最近,通義千問實火。
前段時間被網友玩瘋的全民舞王,讓「AI科目三」頻頻登上熱搜。
讓甄嬛、、馬斯克、貓主子和兵馬俑能跳舞那款AI,就藏在通義千問APP背后。
?
來源:深夜來點薯片
來源:深夜來點薯片
最強國產視覺語言模型了解一下就在這幾天,通義千問團隊又對多模態大模型下手了——
再一次升級通義千問視覺語言模型Qwen-VL,繼Plus版本之后,又推出Max版本。
Qwen-VL是阿里在2023年8月推出的具備圖文理解能力的大模型,基于通義千問語言模型開發。升級后的Qwen-VL視覺水平大幅提升,對很多圖片的理解水平接近人類。
并且,還能夠支持百萬像素以上的高清分辨率圖,以及各種極端長寬比的圖片。
升級版模型限時免費,在通義千問官網和APP都可體驗,API也可免費調用。
評測結果顯示,Qwen-VL的升級版本在MMMU、MathVista等任務上遠超業界所有開源模型,在文檔分析(DocVQA)、中文圖像相關(MM-Be
原文鏈接:中文性能反超VLM頂流GPT-4V,阿里Qwen-VL超大杯限免!看圖秒寫編程視覺難題一眼辨出
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...