Mistral AI新旗艦?zāi)P吞魬?zhàn)Llama 3.1!1230億參數(shù)性能直逼GPT-4o
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:Mistral AI新旗艦模型挑戰(zhàn)Llama 3.1!1230億參數(shù)性能直逼GPT-4o
關(guān)鍵字:模型,性能,語(yǔ)言,成本,基準(zhǔn)
文章來(lái)源:智東西
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
Mistral AI新旗艦?zāi)P椭匕醢l(fā)布:“幻覺(jué)”控制出色。
編譯|孟強(qiáng)
編輯|云鵬
智東西7月25日消息,繼Meta昨日推出開(kāi)源Llama3.1模型之后,法國(guó)初創(chuàng)AI公司Mistral AI也加入了競(jìng)爭(zhēng)行列,推出新一代旗艦?zāi)P蚆istral Large 2。
該模型擁有1230億參數(shù),128k上下文窗口,可以在單個(gè)節(jié)點(diǎn)上以高吞吐量運(yùn)行,支持包括中文在內(nèi)的數(shù)10種語(yǔ)言、80多種編程語(yǔ)言,在多項(xiàng)基準(zhǔn)測(cè)試中接近GPT-4o和Claude 3.5 Sonnet,預(yù)訓(xùn)練版本的多任務(wù)語(yǔ)言理解準(zhǔn)確率高達(dá)84%,擊敗Llama 3.1 70B。
除了性能上的提升,Mistral AI還投入大量成本增強(qiáng)該模型的推理能力,訓(xùn)練的重點(diǎn)放在減少模型產(chǎn)生“幻覺(jué)”的概率,通過(guò)微調(diào)模型,使其在響應(yīng)時(shí)更加謹(jǐn)慎和敏銳,提升模型輸出的精準(zhǔn)度和可信度。
01.
多任務(wù)語(yǔ)言理解超越Llama 3.1 70B
Mistral Large 2擁有128k的上下文窗口,在代碼生成、數(shù)學(xué)和推理方面比Mistral Large功能更強(qiáng)大,并提供更強(qiáng)大的多語(yǔ)言支持和高級(jí)函數(shù)調(diào)用功能,支持包括中文在內(nèi)的10余種語(yǔ)言及Python、Java
原文鏈接:Mistral AI新旗艦?zāi)P吞魬?zhàn)Llama 3.1!1230億參數(shù)性能直逼GPT-4o
聯(lián)系作者
文章來(lái)源:智東西
作者微信:
作者簡(jiǎn)介: