Mistral AI新旗艦?zāi)Ｐ吞魬?zhàn)Llama 3.1！1230億參數(shù)性能直逼GPT-4o

AIGC動(dòng)態(tài)1年前 (2024)發(fā)布智東西

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：Mistral AI新旗艦模型挑戰(zhàn)Llama 3.1！1230億參數(shù)性能直逼GPT-4o
關(guān)鍵字：模型,性能,語言,成本,基準(zhǔn)
文章來源：智東西
內(nèi)容字?jǐn)?shù)：0字

內(nèi)容摘要：

Mistral AI新旗艦?zāi)Ｐ椭匕醢l(fā)布：“幻覺”控制出色。
編譯|孟強(qiáng)
編輯|云鵬
智東西7月25日消息，繼Meta昨日推出開源Llama3.1模型之后，法國初創(chuàng)AI公司Mistral AI也加入了競爭行列，推出新一代旗艦?zāi)Ｐ蚆istral Large 2。
該模型擁有1230億參數(shù)，128k上下文窗口，可以在單個(gè)節(jié)點(diǎn)上以高吞吐量運(yùn)行，支持包括中文在內(nèi)的數(shù)10種語言、80多種編程語言，在多項(xiàng)基準(zhǔn)測(cè)試中接近GPT-4o和Claude 3.5 Sonnet，預(yù)訓(xùn)練版本的多任務(wù)語言理解準(zhǔn)確率高達(dá)84%，擊敗Llama 3.1 70B。
除了性能上的提升，Mistral AI還投入大量成本增強(qiáng)該模型的推理能力，訓(xùn)練的重點(diǎn)放在減少模型產(chǎn)生“幻覺”的概率，通過微調(diào)模型，使其在響應(yīng)時(shí)更加謹(jǐn)慎和敏銳，提升模型輸出的精準(zhǔn)度和可信度。
01.
多任務(wù)語言理解超越Llama 3.1 70B
Mistral Large 2擁有128k的上下文窗口，在代碼生成、數(shù)學(xué)和推理方面比Mistral Large功能更強(qiáng)大，并提供更強(qiáng)大的多語言支持和高級(jí)函數(shù)調(diào)用功能，支持包括中文在內(nèi)的10余種語言及Python、Java

原文鏈接：Mistral AI新旗艦?zāi)Ｐ吞魬?zhàn)Llama 3.1！1230億參數(shù)性能直逼GPT-4o