騰訊推出新一代快思考模型混元 Turbo S:主打秒回、低成本,將在騰訊元寶灰度上線
Turbo S未來將成為騰訊混元系列衍生模型的核心基座~

原標(biāo)題:騰訊推出新一代快思考模型混元 Turbo S:主打秒回、低成本,將在騰訊元寶灰度上線
文章來源:AI前線
內(nèi)容字?jǐn)?shù):2334字
騰訊混元Turbo S大模型發(fā)布:秒回、降本、對(duì)標(biāo)GPT-4
2月27日,騰訊正式發(fā)布了其自研的快思考大模型混元Turbo S。該模型在速度、成本和性能上均有顯著提升,并對(duì)標(biāo)DeepSeek V3、GPT-4o、Claude 3.5等業(yè)界領(lǐng)先模型。
速度提升:秒回體驗(yàn)
與之前的“慢思考”模型不同,混元Turbo S實(shí)現(xiàn)了“秒回”,吐字速度提升一倍,首字時(shí)延降低44%。這得益于其創(chuàng)新的模型架構(gòu)。
成本降低:部署門檻更低
通過Hybrid-Mamba-Transformer融合模式,混元Turbo S降低了計(jì)算復(fù)雜度和緩存占用,大幅降低了訓(xùn)練和推理成本。這是工業(yè)界首次成功將Mamba架構(gòu)無損地應(yīng)用在超大型MoE模型上,實(shí)現(xiàn)了顯存與計(jì)算效率的雙重優(yōu)化。
性能提升:對(duì)標(biāo)行業(yè)領(lǐng)先模型
在多個(gè)公開Benchmark上,混元Turbo S在知識(shí)、數(shù)學(xué)、推理等多個(gè)領(lǐng)域展現(xiàn)出與DeepSeek V3、GPT-4o、Claude 3.5等領(lǐng)先模型相當(dāng)?shù)男ЧMㄟ^長(zhǎng)短思維鏈融合,該模型在保持文科類問題快思考體驗(yàn)的同時(shí),顯著提升了理科推理能力。
應(yīng)用前景:成為騰訊混元系列核心基座
作為旗艦?zāi)P停琓urbo S將成為騰訊混元系列衍生模型的核心基座,為推理、長(zhǎng)文、代碼等衍生模型提供基礎(chǔ)能力。基于Turbo S,騰訊已自研了推理模型T1,并計(jì)劃很快上線其API。
商業(yè)化:價(jià)格大幅下降
目前,開發(fā)者和企業(yè)用戶可以在騰訊云上通過API調(diào)用混元Turbo S,并可享受一周免費(fèi)試用。其定價(jià)也大幅下降,輸入價(jià)格為0.8元/百萬tokens,輸出價(jià)格為2元/百萬tokens。
文章還提及了AI對(duì)軟件工程師就業(yè)的影響,以及3月3日晚將舉辦的關(guān)于AI對(duì)工程師就業(yè)及核心競(jìng)爭(zhēng)力再定義的直播討論。
總而言之,騰訊混元Turbo S的發(fā)布標(biāo)志著國(guó)內(nèi)大模型技術(shù)取得了新的突破,其在速度、成本和性能上的提升,將進(jìn)一步推動(dòng)大模型的應(yīng)用和普及。
聯(lián)系作者
文章來源:AI前線
作者微信:
作者簡(jiǎn)介:面向AI愛好者、開發(fā)者和科學(xué)家,提供大模型最新資訊、AI技術(shù)分享干貨、一線業(yè)界實(shí)踐案例,助你全面擁抱AIGC。

粵公網(wǎng)安備 44011502001135號(hào)