Turbo S未來將成為騰訊混元系列衍生模型的核心基座~
原標題:騰訊推出新一代快思考模型混元 Turbo S:主打秒回、低成本,將在騰訊元寶灰度上線
文章來源:AI前線
內容字數:2334字
騰訊混元Turbo S大模型發布:秒回、降本、對標GPT-4
2月27日,騰訊正式發布了其自研的快思考大模型混元Turbo S。該模型在速度、成本和性能上均有顯著提升,并對標DeepSeek V3、GPT-4o、Claude 3.5等業界領先模型。
速度提升:秒回體驗
與之前的“慢思考”模型不同,混元Turbo S實現了“秒回”,吐字速度提升一倍,首字時延降低44%。這得益于其創新的模型架構。
成本降低:部署門檻更低
通過Hybrid-Mamba-Transformer融合模式,混元Turbo S降低了計算復雜度和緩存占用,大幅降低了訓練和推理成本。這是工業界首次成功將Mamba架構無損地應用在超大型MoE模型上,實現了顯存與計算效率的雙重優化。
性能提升:對標行業領先模型
在多個公開Benchmark上,混元Turbo S在知識、數學、推理等多個領域展現出與DeepSeek V3、GPT-4o、Claude 3.5等領先模型相當的效果。通過長短思維鏈融合,該模型在保持文科類問題快思考體驗的同時,顯著提升了理科推理能力。
應用前景:成為騰訊混元系列核心基座
作為旗艦模型,Turbo S將成為騰訊混元系列衍生模型的核心基座,為推理、長文、代碼等衍生模型提供基礎能力。基于Turbo S,騰訊已自研了推理模型T1,并計劃很快上線其API。
商業化:價格大幅下降
目前,開發者和企業用戶可以在騰訊云上通過API調用混元Turbo S,并可享受一周免費試用。其定價也大幅下降,輸入價格為0.8元/百萬tokens,輸出價格為2元/百萬tokens。
文章還提及了AI對軟件工程師就業的影響,以及3月3日晚將舉辦的關于AI對工程師就業及核心競爭力再定義的直播討論。
總而言之,騰訊混元Turbo S的發布標志著國內大模型技術取得了新的突破,其在速度、成本和性能上的提升,將進一步推動大模型的應用和普及。
聯系作者
文章來源:AI前線
作者微信:
作者簡介:面向AI愛好者、開發者和科學家,提供大模型最新資訊、AI技術分享干貨、一線業界實踐案例,助你全面擁抱AIGC。