騰訊混元大模型
騰訊混元大模型是由騰訊研發(fā)的大語言模型,具備強(qiáng)大的中文創(chuàng)作能力,復(fù)雜語境下的邏輯推理能力,以及可靠的任務(wù)執(zhí)行能力。
標(biāo)簽:AI大模型 AI訓(xùn)練模型 大模型API 騰訊AI 騰訊云AI大模型 AI訓(xùn)練模型 人工智能訓(xùn)練模型 混元AI大模型 混元大模型 混元大模型發(fā)布時間 混元大模型官網(wǎng) 騰訊 騰訊 AI 騰訊 AI Lab 訓(xùn)練騰訊混元大模型介紹
騰訊混元大模型是由騰訊全鏈路自研的通用大語言模型,擁有超千億參數(shù)規(guī)模,預(yù)訓(xùn)練語料超 2 萬億 tokens,具備強(qiáng)大的中文創(chuàng)作能力,復(fù)雜語境下的邏輯推理能力,以及可靠的任務(wù)執(zhí)行能力。
值得一提的是,騰訊混元大模型是一個“從實(shí)踐中來,到實(shí)踐中去”的實(shí)用級大模型。當(dāng)前,騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ 瀏覽器等超過 50 個騰訊業(yè)務(wù)和產(chǎn)品,已經(jīng)接入騰訊混元大模型測試,并取得初步效果。
騰訊混元大模型API
騰訊混元大模型官網(wǎng)
- 騰訊混元助手官網(wǎng):https://hunyuan.tencent.com/
- 騰訊混元助手小程序:微信中搜索“騰訊混元助手”或者掃描下方小程序碼體驗

- 騰訊混元公眾號:微信中搜索”騰訊混元”公眾號
騰訊將于9月7日正式發(fā)布混元大模型,請大家關(guān)注2023年騰訊全球數(shù)字生態(tài)大會。
混元AI大模型發(fā)布會視頻直播
混元AI大模型的特點(diǎn)
全鏈路自研是騰訊混元大模型的首要特點(diǎn)。騰訊集團(tuán)副總裁蔣杰介紹,騰訊混元大模型從第一個 token 開始從零訓(xùn)練,掌握了從模型算法到機(jī)器學(xué)習(xí)框架,再到AI基礎(chǔ)設(shè)施的全鏈路自研技術(shù)。
騰訊在算法層面進(jìn)行了一系列自研創(chuàng)新,提高了模型可靠性和成熟度。
針對大模型容易“胡言亂語”的問題,騰訊優(yōu)化了預(yù)訓(xùn)練算法及策略,讓混元大模型的幻覺相比主流開源大模型降低了 30% 至 50%;通過強(qiáng)化學(xué)習(xí)的方法,讓模型學(xué)會識別陷阱問題;通過位置編碼優(yōu)化,提高了超長文的處理效果和性能;提出思維鏈的新策略,讓大模型能夠像人一樣結(jié)合實(shí)際的應(yīng)用場景進(jìn)行推理和決策。
此外,騰訊還自研了機(jī)器學(xué)習(xí)框架 Angel,使訓(xùn)練速度相比業(yè)界主流框架提升 1 倍,推理速度比業(yè)界主流框架提升 1.3 倍。
得益于全鏈路自研技術(shù),騰訊混元大模型能夠理解上下文的含義,并且有長文記憶能力,可以流暢地進(jìn)行專業(yè)領(lǐng)域的多輪對話。除此之外,它還能進(jìn)行文學(xué)創(chuàng)作、文本摘要、角色扮演等內(nèi)容創(chuàng)作,做到充分理解用戶意圖,并高效、準(zhǔn)確地給出有時效性的答復(fù)。
騰訊混元大模型架構(gòu)
據(jù)報道,今年5月,騰訊針對ChatGPT對話式產(chǎn)品成立了“混元助手(HunyuanAide)”項目組,由騰訊首席科學(xué)家、騰訊AI Lab及Robotics X實(shí)驗室主任張正友博士負(fù)責(zé)。
以太極平臺的基礎(chǔ),配合強(qiáng)大的底層算力與低成本的高速網(wǎng)絡(luò)基礎(chǔ)設(shè)施,騰訊打造了首個可在工業(yè)界海量業(yè)務(wù)場景直接落地,并投入應(yīng)用的萬億NLP大模型——HunYuan-NLP 1T。混元最快僅用256卡在一天內(nèi)即可完成萬億參數(shù)大模型的訓(xùn)練,整體訓(xùn)練成本僅為直接冷啟動訓(xùn)練萬億模型的1/8。
縱觀混元在騰訊應(yīng)用層、模型層的布局,我們可以發(fā)現(xiàn),這樣的布局策略,很有可能是想以統(tǒng)一的平臺,實(shí)現(xiàn)技術(shù)復(fù)用和業(yè)務(wù)降本,支持更多的場景和應(yīng)用。而這樣的技術(shù)復(fù)用和多場景支持,則與騰訊在互聯(lián)網(wǎng)領(lǐng)域獨(dú)特的生態(tài)位有著密切關(guān)系。

混元大模型應(yīng)用
在2023年騰訊全球數(shù)字生態(tài)大會上,蔣杰展示了騰訊會議、騰訊文檔、騰訊廣告等多個業(yè)務(wù),在接入騰訊混元大模型后的實(shí)際應(yīng)用情況。
比如騰訊會議基于混元大模型打造了騰訊混元助手,只需要簡單的自然語言指令,就能完成會議信息提取、內(nèi)容分析等復(fù)雜任務(wù),會后還能生成智能總結(jié)紀(jì)要。據(jù)實(shí)測,在指令理解、會中問答、會議摘要、會議待辦項等多個方面,混元大模型均獲得較高的用戶采納率。
在文檔處理方面,騰訊混元大模型支持?jǐn)?shù)十種文本創(chuàng)作場景,在騰訊文檔推出的智能助手功能中已有應(yīng)用。同時,混元還能夠一鍵生成標(biāo)準(zhǔn)格式文本,精通數(shù)百種Excel公式,支持自然語言生成函數(shù),并基于表格內(nèi)容生成圖表,目前這些功能正在內(nèi)測階段,將在成熟后面向用戶開放。
在廣告業(yè)務(wù)場景,騰訊混元大模型支持智能化的廣告素材創(chuàng)作,能夠適應(yīng)行業(yè)與地域特色,滿足千人千面的需求,實(shí)現(xiàn)文字、圖片、視頻的自然融合。此外,基于混元大模型的能力,廣告智能導(dǎo)購能夠幫助商家在企業(yè)微信等場景,提升服務(wù)質(zhì)量和服務(wù)效率。
混元大模型歷史消息
3月30日,騰訊集團(tuán)高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生向媒體表示,騰訊正在研發(fā)類ChatGPT機(jī)器人。
騰訊在大模型領(lǐng)域的布局早已有之,其“混元”系列AI大模型覆蓋了NLP、CV、多模態(tài)等基礎(chǔ)大模型以及眾多行業(yè)/領(lǐng)域大模型。這成為了騰訊構(gòu)建類ChatGPT產(chǎn)品的堅實(shí)技術(shù)儲備。
2022年5月,騰訊混元AI大模型在CLUE總排行榜、閱讀理解、大規(guī)模知識圖譜三個榜單同時登頂,一舉打破三項紀(jì)錄。

騰訊混元助手名稱變更歷史
數(shù)據(jù)評估
本站OpenI提供的騰訊混元大模型都來源于網(wǎng)絡(luò),不保證外部鏈接的準(zhǔn)確性和完整性,同時,對于該外部鏈接的指向,不由OpenI實(shí)際控制,在2023年 8月 4日 下午12:54收錄時,該網(wǎng)頁上的內(nèi)容,都屬于合規(guī)合法,后期網(wǎng)頁的內(nèi)容如出現(xiàn)違規(guī),可以直接聯(lián)系網(wǎng)站管理員進(jìn)行刪除,OpenI不承擔(dān)任何責(zé)任。