最強(qiáng)代碼模型刷新：Mistral新品上線(xiàn)即登頂，上下文窗口增至256k

HumanEval測(cè)試多種語(yǔ)言達(dá)到SOTA

原標(biāo)題：最強(qiáng)代碼模型刷新：Mistral新品上線(xiàn)即登頂，上下文窗口增至256k
文章來(lái)源：量子位
內(nèi)容字?jǐn)?shù)：2671字

歐洲版OpenAI的代碼模型CodeStral 2501登頂代碼競(jìng)技場(chǎng)

Mistral AI的代碼模型CodeStral 2501在Copilot Arena代碼競(jìng)技場(chǎng)中取得第一名，與DeepSeek V2.5和Claude 3.5 Sonnet并列。這標(biāo)志著代碼模型領(lǐng)域的一個(gè)重大進(jìn)步，其性能在多個(gè)基準(zhǔn)測(cè)試中都達(dá)到了最先進(jìn)水平（SOTA）。

性能提升與新特性

速度提升：CodeStral 2501使用了更高效的架構(gòu)和分詞器，生成速度比前一代快約2倍。
上下文窗口擴(kuò)大：上下文窗口從之前的32k增長(zhǎng)到256k，是之前的8倍。
SOTA性能：在HumanEval等傳統(tǒng)測(cè)試和Copilot Arena中，CodeStral 2501在多個(gè)指標(biāo)上取得了SOTA成績(jī)，尤其在代碼補(bǔ)全（FIM）方面表現(xiàn)出色。
多語(yǔ)言支持：支持80多種編程語(yǔ)言，并在Python、C++、JS等常用語(yǔ)言中取得SOTA成績(jī)，甚至實(shí)現(xiàn)了C#語(yǔ)言得分過(guò)半。不過(guò)在Java語(yǔ)言上的表現(xiàn)有所下降。
FIM性能提升：在FIM（單行精確匹配）任務(wù)中，CodeStral 2501的平均成績(jī)以及Python、Java和JS三個(gè)單項(xiàng)均比前一代有所進(jìn)步，并優(yōu)于OpenAI FIM API 3.5 Turbo等其他模型。

Copilot Arena競(jìng)技場(chǎng)

Copilot Arena是由卡內(nèi)基梅隆大學(xué)和UC伯克利的研究人員與LMArena合作推出的開(kāi)源編程工具，用戶(hù)可以提交問(wèn)題，系統(tǒng)隨機(jī)選擇兩個(gè)模型匿名輸出，用戶(hù)根據(jù)輸出選擇優(yōu)勝者。CodeStral 2501在超過(guò)1.7萬(wàn)場(chǎng)battle中脫穎而出，取得了第一名的成績(jī)。

可用性與定價(jià)

CodeStral 2501可以通過(guò)Mistral的合作方Continue.dev在VSCode或Jetbrains系列IDE中使用，也可以通過(guò)API自行部署。定價(jià)為每百萬(wàn)輸入/輸出token 0.3/0.9美元或歐元。

總結(jié)

CodeStral 2501的出現(xiàn)標(biāo)志著代碼模型領(lǐng)域的一次重大飛躍。其顯著的性能提升、更大的上下文窗口以及在多個(gè)編程語(yǔ)言中的SOTA表現(xiàn)，使其成為目前最強(qiáng)大的代碼模型之一。值得關(guān)注的是，雖然在一些特定語(yǔ)言（如Java）上的表現(xiàn)略有下降，但整體而言，CodeStral 2501在代碼生成和補(bǔ)全方面展現(xiàn)出了強(qiáng)大的實(shí)力。

聯(lián)系作者

文章來(lái)源：量子位
作者微信：
作者簡(jiǎn)介：追蹤人工智能新趨勢(shì)，關(guān)注科技行業(yè)新突破

閱讀原文

# AIGC動(dòng)態(tài)# AI模型參數(shù)量 # Mistral大模型 # 上下文窗口256k # 大模型性能評(píng)測(cè)# 最強(qiáng)代碼模型

? 版權(quán)聲明

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載。

暫無(wú)評(píng)論

暫無(wú)評(píng)論...

国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

最強(qiáng)代碼模型刷新：Mistral新品上線(xiàn)即登頂，上下文窗口增至256k

HumanEval測(cè)試多種語(yǔ)言達(dá)到SOTA

歐洲版OpenAI的代碼模型CodeStral 2501登頂代碼競(jìng)技場(chǎng)

性能提升與新特性

Copilot Arena競(jìng)技場(chǎng)

可用性與定價(jià)

總結(jié)

聯(lián)系作者

2024年AI重點(diǎn)事件辣評(píng)，一起來(lái)聊聊 | 直播預(yù)告

剛剛，美國(guó)全球芯片禁令正式發(fā)布

相關(guān)文章

暫無(wú)評(píng)論

ChatGPT

玩虛擬模特？