AIGC動態歡迎閱讀
原標題:馬斯克旗下xAI發布首個多模態大模型!
關鍵字:模型,基準,能力,圖表,測試
文章來源:大數據文摘
內容字數:3857字
內容摘要:
大數據文摘受權轉載自頭部科技
文丨Congerry
3月中旬,馬斯克旗下的 xAI 剛剛宣布開源 Grok-1 大模型!
一個月過去,xAI 又掏出了 Grok-1.5V。
Grok-1.5V是xAI開發的第一款多模態模型。
除了強大的文本處理能力,Grok現在還可以處理包括文檔、圖表、截圖和照片在內的多種視覺信息。
xAI宣稱Grok-1.5V能在多個領域與現有的前沿多模態模型競爭,包括跨學科推理、理解文檔、科學圖表、圖表、截圖和照片。特別強調了Grok在理解物理世界方面的能力。
而且所有數據集都是在零樣本設置下評估的,沒有使用思維鏈提示。這意味著在評估這些多模態模型的性能時,模型沒有接受過任何特定于測試任務的訓練或示例(即零樣本),也沒有通過一系列的邏輯推理步驟(即思維鏈提示)來輔助解決問題,完全依靠自身的能力來處理和回答問題,展示了它們的真實性能和泛化能力。
從這張圖表中可以看出,Grok-1.5V在MMMU多學科、Mathvista數學、AI2D圖表、TextVQA文本閱讀、ChartQA圖表、DocVQA文檔等多項基準測試中,表現已經逼近頭部模型。
淺試一下讓Grok把這張圖
原文鏈接:馬斯克旗下xAI發布首個多模態大模型!
聯系作者
文章來源:大數據文摘
作者微信:BigDataDigest
作者簡介:普及數據思維,傳播數據文化
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...