AIGC動態歡迎閱讀
原標題:騰訊混元文生圖大模型全面開源!Sora同架構,更懂中文,免費商用
關鍵字:騰訊,模型,架構,中文,能力
文章來源:智東西
內容字數:9404字
內容摘要:
首個中文原生DiT架構,中文原生文生圖大模型來了!
作者|ZeR0
編輯|漠影
智東西5月15日報道,騰訊文生圖負責人蘆清林周二宣布騰訊混元文生圖大模型全面開源。
該模型已在Hugging Face平臺及Github上發布,包含模型權重、推理代碼、模型算法等完整模型,與騰訊混元文生圖產品最新版本完全一致,基于騰訊海量應用場景訓練,可供企業與個人開發者免費商用。
這是業內首個中文原生的DiT架構文生圖開源模型,支持中英文雙語輸入及理解,參數量15億。
跟其他業界開源模型對比,混元DiT在多個維度上無短板,并在美學和清晰度維度上具有一定優勢。其綜合指標在所有開源和閉源算法中排名第三,實現開源版本中的SOTA。
評測數據顯示,騰訊混元文生圖模型效果遠超開源的Stable Diffusion模型及其他開源文生圖模型,是目前效果最好的開源文生圖模型;整體能力屬于國際領先水平。
升級后的混元文生圖大模型采用了與Sora、Stable Diffusion 3一致的DiT架構,可支持文生圖,也可作為視頻等多模態視覺生成的基礎。
混元文生圖整體模型主要由3個部分組成:a)多模態大語言模型,支持用戶文本改
原文鏈接:騰訊混元文生圖大模型全面開源!Sora同架構,更懂中文,免費商用
聯系作者
文章來源:智東西
作者微信:zhidxcom
作者簡介:智能產業新媒體!智東西專注報道人工智能主導的前沿技術發展,和技術應用帶來的千行百業產業升級。聚焦智能變革,服務產業升級。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...