騰訊混元文生圖大模型全面開源！Sora同架構，更懂中文，免費商用

AIGC動態2年前 (2024)發布智東西

AIGC動態歡迎閱讀

原標題：騰訊混元文生圖大模型全面開源！Sora同架構，更懂中文，免費商用
關鍵字：騰訊,模型,架構,中文,能力
文章來源：智東西
內容字數：9404字

內容摘要：

首個中文原生DiT架構，中文原生文生圖大模型來了！
作者|ZeR0
編輯|漠影
智東西5月15日報道，騰訊文生圖負責人蘆清林周二宣布騰訊混元文生圖大模型全面開源。
該模型已在Hugging Face平臺及Github上發布，包含模型權重、推理代碼、模型算法等完整模型，與騰訊混元文生圖產品最新版本完全一致，基于騰訊海量應用場景訓練，可供企業與個人開發者免費商用。
這是業內首個中文原生的DiT架構文生圖開源模型，支持中英文雙語輸入及理解，參數量15億。
跟其他業界開源模型對比，混元DiT在多個維度上無短板，并在美學和清晰度維度上具有一定優勢。其綜合指標在所有開源和閉源算法中排名第三，實現開源版本中的SOTA。
評測數據顯示，騰訊混元文生圖模型效果遠超開源的Stable Diffusion模型及其他開源文生圖模型，是目前效果最好的開源文生圖模型；整體能力屬于國際領先水平。
升級后的混元文生圖大模型采用了與Sora、Stable Diffusion 3一致的DiT架構，可支持文生圖，也可作為視頻等多模態視覺生成的基礎。
混元文生圖整體模型主要由3個部分組成：a）多模態大語言模型，支持用戶文本改

原文鏈接：騰訊混元文生圖大模型全面開源！Sora同架構，更懂中文，免費商用