AIGC動態歡迎閱讀
原標題:首個中文原生DiT架構,已開源!大模型Hunyuan-DiT技術報告詳解
關鍵字:報告,模型,圖像,文本,數據
文章來源:算法邦
內容字數:20718字
內容摘要:
直播預告 | 5月23日晚7點,「智猩猩機器人新青年講座」第6講正式開講,論文一作、清華大學在讀博士郭旭東將直播講解《大模型在具身多智能體合作中的研究進展與展望》,歡迎掃名~非常令人激動,騰訊混元文生圖大模型已在 Hugging Face 平臺及 Github 上發布,包含模型權重、推理代碼、模型算法等完整模型。
且不管是企業還是個人開發者,全部免費可用。
主頁:https://dit.hunyuan.tencent.com/ 代碼:https://github.com/Tencent/HunyuanDiT下面來詳細介紹下混元大模型的技術細節,期待國內更多大模型能發布,讓AIGC行業應用全面爆發:
Hunyuan-DiT,這是一種具備細粒度理解能力的文本到圖像擴散transformer,能夠處理中文和英文。為了構建Hunyuan-DiT,精心設計了transformer結構、文本編碼器和位置編碼。此外,還從頭開始建立了完整的數據pipeline,以更新和評估數據,進行迭代的模型優化。
為了實現細粒度的語言理解,訓練了一種多模態大語言模型,用于細化圖像的標題描述。最終,Hunyuan
原文鏈接:首個中文原生DiT架構,已開源!大模型Hunyuan-DiT技術報告詳解
聯系作者
文章來源:算法邦
作者微信:allplusai
作者簡介:智猩猩矩陣賬號之一,聚焦生成式AI,重點關注模型與應用。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...