歐洲名將 Mistral 發布首個多模態模型,12B 開源下載,黃仁勛站臺
AIGC動態歡迎閱讀
原標題:歐洲名將 Mistral 發布首個多模態模型,12B 開源下載,黃仁勛站臺
關鍵字:報告,模型,圖像,基準,圖表
文章來源:Founder Park
內容字數:0字
內容摘要:
法國 AI 初創 Mistral AI,又扔出一條磁力鏈炸場了。
這次,與以往不同的是,他們發布了首個多模態模型 Pixtral 12B,集語言、視覺能力于一身。
這意味著,Mistral AI 正式跨界 MMML,開啟多模態 AI 新時代,同時向 OpenAI、Anthropic 等勁敵發起挑戰。
多模態 Pixtral 12B,是基于文本模型 Nemo 12B 完成訓練。
與 GPT-4o、Claude 類似,只需上傳一張圖、提供一個鏈接,模型就能根據提示回答問題。它不僅能夠識別復雜手寫筆記,還能看懂數學公式、圖表等等。
在多項基準測試(文本、指令跟隨、多模態)中,新模型性能大幅超越 Qwen2 7B、Phi-3 Vision 開源模型。
Hugging Face 技術負責人發現此處列舉的 Qwen 的數據問題很大
相較于閉源模型,Pixtral 12B 在圖表問答、文檔問答、視覺數學推理、大學水平多學科等基準中,性能碾壓 Claude3 Haiku、Gemini 1.5 8B。
除了大約 24GB 的磁力鏈,模型代碼還可在 HuggingFace、GitHub 下載。(由社區開發
原文鏈接:歐洲名將 Mistral 發布首個多模態模型,12B 開源下載,黃仁勛站臺
聯系作者
文章來源:Founder Park
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...