引領(lǐng)未來(lái)的視頻創(chuàng)作:騰訊Sora免費(fèi)開放,參數(shù)量最大文生視頻模型來(lái)襲!
騰訊開源進(jìn)一步促進(jìn)大模型生態(tài)繁榮發(fā)展。
原標(biāo)題:開源社區(qū)參數(shù)量最大的文生視頻模型來(lái)了,騰訊版Sora免費(fèi)使用
文章來(lái)源:機(jī)器之心
內(nèi)容字?jǐn)?shù):9780字
騰訊混元視頻生成模型開源概覽
近日,騰訊宣布旗下的混元視頻生成大模型HunYuan-Video(HY-Video)正式對(duì)外開源。這款參數(shù)量達(dá)到130億的模型為企業(yè)與個(gè)人開發(fā)者提供了全新的視頻生成工具,旨在促進(jìn)視頻生成領(lǐng)域的開源生態(tài)發(fā)展。
1. 模型特點(diǎn)
HunYuan-Video具備以下幾個(gè)顯著特點(diǎn):
- 卓越畫質(zhì):提供超寫實(shí)的視覺體驗(yàn),支持真實(shí)與虛擬風(fēng)格的無(wú)縫切換。
- 動(dòng)態(tài)流暢:突破了動(dòng)態(tài)圖像的局限,實(shí)現(xiàn)完整大幅度動(dòng)作的流暢演繹。
- 語(yǔ)義遵從:以多模態(tài)大語(yǔ)言模型為文本編碼器,展現(xiàn)出強(qiáng)大的語(yǔ)義理解能力。
- 原生鏡頭轉(zhuǎn)換:具備多視角鏡頭切換能力,能夠?qū)崿F(xiàn)藝術(shù)鏡頭無(wú)縫銜接。
2. 開源資源與應(yīng)用
HunYuan-Video的開源資源包括官網(wǎng)鏈接、代碼庫(kù)和技術(shù)報(bào)告,用戶可通過騰訊元寶APP申請(qǐng)?jiān)囉迷摴δ堋T撃P驮诙鄠€(gè)應(yīng)用場(chǎng)景中表現(xiàn)出色,能夠?qū)崿F(xiàn)高質(zhì)量的文生視頻創(chuàng)作。
3. 技術(shù)創(chuàng)新與架構(gòu)設(shè)計(jì)
混元團(tuán)隊(duì)在模型架構(gòu)設(shè)計(jì)中引入了多個(gè)創(chuàng)新技術(shù),包括:
- 自研的3D視覺編碼器,支持圖像與視頻混合訓(xùn)練。
- 采用全注意力機(jī)制,提升畫面流暢度并實(shí)現(xiàn)主體一致的多視角切換。
- 基于Scaling Law的設(shè)計(jì)與訓(xùn)練,優(yōu)化模型參數(shù)與數(shù)據(jù)配比。
4. 開源生態(tài)的未來(lái)
騰訊混元系列模型的開源進(jìn)程不斷加快,未來(lái)將繼續(xù)推出更多基于視頻創(chuàng)作的模型與生態(tài)插件,促進(jìn)大模型生態(tài)的繁榮發(fā)展。騰訊對(duì)開源社區(qū)的貢獻(xiàn)已超過170個(gè)項(xiàng)目,吸引了大量開發(fā)者的關(guān)注。
總而言之,HunYuan-Video的開源不僅為視頻生成領(lǐng)域帶來(lái)了新的機(jī)遇,也為創(chuàng)作者與開發(fā)者提供了強(qiáng)大的工具,有望推動(dòng)整個(gè)行業(yè)的創(chuàng)新與發(fā)展。
聯(lián)系作者
文章來(lái)源:機(jī)器之心
作者微信:
作者簡(jiǎn)介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)