60億AI獨(dú)角獸Mistral祭出磁力鏈,首個(gè)多模態(tài)Pixtral 12B登場(chǎng)!但被大佬曝出評(píng)測(cè)造假
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:60億AI獨(dú)角獸Mistral祭出磁力鏈,首個(gè)多模態(tài)Pixtral 12B登場(chǎng)!但被大佬曝出評(píng)測(cè)造假
關(guān)鍵字:報(bào)告,模型,圖表,圖像,基準(zhǔn)
文章來(lái)源:新智元
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
新智元報(bào)道編輯:桃子 好困
【新智元導(dǎo)讀】一條磁力鏈,又在AI圈掀起狂瀾。成立一年法國(guó)AI獨(dú)角獸Mistral,官宣首個(gè)多模態(tài)模型Pixtral 12B,不僅能看懂手繪稿,還可以理解復(fù)雜公式、圖表。法國(guó)AI初創(chuàng)Mistral AI,又扔出一條磁力鏈炸場(chǎng)了。
這次,與以往不同的是,他們發(fā)布了首個(gè)多模態(tài)模型Pixtral 12B,集語(yǔ)言、視覺(jué)能力于一身。
這意味著,Mistral AI正式跨界MMML,開(kāi)啟多模態(tài)AI新時(shí)代,同時(shí)向OpenAI、Anthropic等勁敵發(fā)起挑戰(zhàn)。
多模態(tài)Pixtral 12B,是基于文本模型Nemo 12B完成訓(xùn)練。
與GPT-4o、Claude類似,只需上傳一張圖、提供一個(gè)鏈接,模型就能根據(jù)提示回答問(wèn)題。
它不僅能夠識(shí)別復(fù)雜手寫筆記,還能看懂?dāng)?shù)學(xué)公式、圖表等等。
在多項(xiàng)基準(zhǔn)測(cè)試(文本、指令跟隨、多模態(tài))中,新模型性能大幅超越Qwen2 7B、Phi-3 Vision開(kāi)源模型。
Hugging Face技術(shù)負(fù)責(zé)人發(fā)現(xiàn)此處列舉的Qwen的數(shù)據(jù)問(wèn)題很大
相較于閉源模型,Pixtral 12B在圖表問(wèn)答、文檔問(wèn)答、視覺(jué)數(shù)學(xué)推理、大學(xué)水平多學(xué)科等基準(zhǔn)中,性能碾壓C
原文鏈接:60億AI獨(dú)角獸Mistral祭出磁力鏈,首個(gè)多模態(tài)Pixtral 12B登場(chǎng)!但被大佬曝出評(píng)測(cè)造假
聯(lián)系作者
文章來(lái)源:新智元
作者微信:
作者簡(jiǎn)介: