AIGC動態歡迎閱讀
原標題:騰訊混元康戰輝:將開源大模型訓練代碼,但數據開源意義不大
關鍵字:騰訊,模型,企鵝,能力,數據
文章來源:AI前線
內容字數:0字
內容摘要:
11 月 5 日,騰訊混元宣布最新的 MoE 模型“混元 Large“以及混元 3D 生成大模型“ Hunyuan3D-1.0”正式開源,支持企業及開發者精調、部署等不同場景的使用需求,且免費可商用。
其中,騰訊混元 Large 是目前開源領域參數規模最大、效果最好的 MoE 模型,而騰訊混元 3D 生成大模型則是業界首個同時支持文字、圖像生成 3D 的開源大模型。目前,兩個模型均已經在騰訊業務場景中落地應用,經過實踐的檢驗,是面向實用場景的應用級大模型。“現在開源真的一點不晚”
在騰訊機器學習平臺總監、騰訊混元大語言模型算法負責人康戰輝看來,去年大模型如火如荼,開源也是百花齊放,但如今來看,還是各歸各位。“底層模型不是 C 端產品,不存在入口、流量,這個我們可以沉下心來長期深耕,所以現在開源真的一點不晚。”
騰訊混元這次開源的 Large 模型總參數量 389B,激活參數量 52B ,上下文長度高達 256K。根據公開測評結果,騰訊混元 Large 在 CMMLU、MMLU、CEval、MATH 等多學科綜合評測集以及中英文 NLP 任務、代碼和數學等 9 大維度全面領先,超過 Ll
原文鏈接:騰訊混元康戰輝:將開源大模型訓練代碼,但數據開源意義不大
聯系作者
文章來源:AI前線
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...