騰訊最新萬億參數異構MoE上線，技術細節首次曝光！權威評測國內第一，直逼GPT-4o

AIGC動態1年前 (2024)發布新智元

AIGC動態歡迎閱讀

原標題：騰訊最新萬億參數異構MoE上線，技術細節首次曝光！權威評測國內第一，直逼GPT-4o
關鍵字：騰訊,模型,能力,報告,解讀
文章來源：新智元
內容字數：0字

內容摘要：

新智元報道編輯：桃子好困
【新智元導讀】鵝廠新一代旗艦大模型混元Turbo技術報告首次曝光。模型采用全新分層異構的MoE架構，總參數達萬億級別，性能僅次于GPT-4o，位列國內第一梯隊。近期，騰訊混元推出新一代旗艦大模型——混元Turbo。
作為國內率先采用MoE結構大模型的公司，騰訊繼續在這一技術路線上進行技術創新。
相較上一代混元Pro的同構MoE大模型結構，混元Turbo采用了全新的分層異構MoE結構，在參數總規模上依然保持萬億級。
公開信息顯示，當前混元Turbo模型在業界公認的benchmark指標上處于國內行業領先地位，與國外頭部模型如GPT-4o等相比也處于第一梯隊。
另外，在剛剛發布的國內第三方權威評測機構評測中，混元Turbo模型位列國內第一。混元Turbo是如何做到如此快速的進步？
背后技術細節首公開我們拿到了混元Turbo的技術解讀，從Pretrain、Postrain和專項能力突破幾個角度，深入展示了模型升級的秘密。
首先，業界目前普遍公認，大模型Pretrain成功的關鍵秘訣之一是Scaling Law。
可以簡單理解為，訓練數據量越大，模型效果越好；參數