112頁報告深挖GPT-4V!UCLA等發(fā)布全新「多模態(tài)數(shù)學推理」基準MathVista
AIGC動態(tài)歡迎閱讀
原標題:112頁報告深挖GPT-4V!UCLA等發(fā)布全新「多模態(tài)數(shù)學推理」基準MathVista
文章來源:新智元
內(nèi)容字數(shù):12656字
內(nèi)容摘要:新智元報道編輯:LRS 好困【新智元導讀】大型多模態(tài)模型會做數(shù)學題嗎?在UCLA等機構最新發(fā)布的MathVista基準上,即使是當前最強的GPT-4V也會感到「挫敗感」。最近,UCLA等機構發(fā)布了一個名為MathVista的全新多模態(tài)數(shù)學推理基準數(shù)據(jù)集,同時提供了一份涵蓋112頁的詳細評測報告,專注于大型多模態(tài)模型的數(shù)學推理表現(xiàn)。論文地址:https://arxiv.org/abs/2310.02255項目地址:https://mathvista.github.io/HF數(shù)據(jù)集:https://huggingface.co/datasets/AI4Math/MathVista數(shù)據(jù)可視化:https://mathvista.github.io/#visualizationLeaderboard:https://mathvista.github.io/#leaderboard數(shù)學推理能力被視為…
原文鏈接:點此閱讀原文:112頁報告深挖GPT-4V!UCLA等發(fā)布全新「多模態(tài)數(shù)學推理」基準MathVista
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發(fā)展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。