60億AI獨(dú)角獸Mistral祭出磁力鏈,首個(gè)多模態(tài)Pixtral 12B登場!但被大佬曝出評(píng)測造假

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:60億AI獨(dú)角獸Mistral祭出磁力鏈,首個(gè)多模態(tài)Pixtral 12B登場!但被大佬曝出評(píng)測造假
關(guān)鍵字:報(bào)告,模型,圖表,圖像,基準(zhǔn)
文章來源:新智元
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
新智元報(bào)道編輯:桃子 好困
【新智元導(dǎo)讀】一條磁力鏈,又在AI圈掀起狂瀾。成立一年法國AI獨(dú)角獸Mistral,官宣首個(gè)多模態(tài)模型Pixtral 12B,不僅能看懂手繪稿,還可以理解復(fù)雜公式、圖表。法國AI初創(chuàng)Mistral AI,又扔出一條磁力鏈炸場了。
這次,與以往不同的是,他們發(fā)布了首個(gè)多模態(tài)模型Pixtral 12B,集語言、視覺能力于一身。
這意味著,Mistral AI正式跨界MMML,開啟多模態(tài)AI新時(shí)代,同時(shí)向OpenAI、Anthropic等勁敵發(fā)起挑戰(zhàn)。
多模態(tài)Pixtral 12B,是基于文本模型Nemo 12B完成訓(xùn)練。
與GPT-4o、Claude類似,只需上傳一張圖、提供一個(gè)鏈接,模型就能根據(jù)提示回答問題。
它不僅能夠識(shí)別復(fù)雜手寫筆記,還能看懂?dāng)?shù)學(xué)公式、圖表等等。
在多項(xiàng)基準(zhǔn)測試(文本、指令跟隨、多模態(tài))中,新模型性能大幅超越Qwen2 7B、Phi-3 Vision開源模型。
Hugging Face技術(shù)負(fù)責(zé)人發(fā)現(xiàn)此處列舉的Qwen的數(shù)據(jù)問題很大
相較于閉源模型,Pixtral 12B在圖表問答、文檔問答、視覺數(shù)學(xué)推理、大學(xué)水平多學(xué)科等基準(zhǔn)中,性能碾壓C
原文鏈接:60億AI獨(dú)角獸Mistral祭出磁力鏈,首個(gè)多模態(tài)Pixtral 12B登場!但被大佬曝出評(píng)測造假
聯(lián)系作者
文章來源:新智元
作者微信:
作者簡介:

粵公網(wǎng)安備 44011502001135號(hào)