全球首個自主進(jìn)化多模態(tài)MoE震撼登場!寫真視頻擊敗Sora,人大系團(tuán)隊(duì)自研底座VDT
AIGC動態(tài)歡迎閱讀
原標(biāo)題:全球首個自主進(jìn)化多模態(tài)MoE震撼登場!寫真視頻擊敗Sora,人大系團(tuán)隊(duì)自研底座VDT
關(guān)鍵字:模型,智能,任務(wù),視頻,數(shù)據(jù)
文章來源:新智元
內(nèi)容字?jǐn)?shù):6922字
內(nèi)容摘要:
新智元報道編輯:編輯部
【新智元導(dǎo)讀】人大系初創(chuàng)公司智子引擎發(fā)布的全新多模態(tài)大模型Awaker 1.0,直接邁向了AGI!它是業(yè)界首個真正實(shí)現(xiàn)自主更新的大模型,在寫真視頻效果上,居然擊敗了Sora。在4月27日召開的中關(guān)村論壇通用人工智能平行論壇上,人大系初創(chuàng)公司智子引擎隆重發(fā)布全新的多模態(tài)大模型Awaker 1.0,向AGI邁出至關(guān)重要的一步。
相對于智子引擎前代的ChatImg序列模型,Awaker 1.0采用全新的MOE架構(gòu)并具備自主更新能力,是業(yè)界首個實(shí)現(xiàn)「真正」自主更新的多模態(tài)大模型。
在視覺生成方面,Awaker 1.0采用完全自研的視頻生成底座VDT,在寫真視頻生成上取得好于Sora的效果,打破大模型 「最后一公里」落地難的困境。
Awaker 1.0是一個將視覺理解與視覺生成進(jìn)行超級融合的多模態(tài)大模型。
在理解側(cè),Awaker 1.0與數(shù)字世界和現(xiàn)實(shí)世界進(jìn)行交互,在執(zhí)行任務(wù)的過程中將場景行為數(shù)據(jù)反哺給模型,以實(shí)現(xiàn)持續(xù)更新與訓(xùn)練;在生成側(cè),Awaker 1.0可以生成高質(zhì)量的多模態(tài)內(nèi)容,對現(xiàn)實(shí)世界進(jìn)行模擬,為理解側(cè)模型提供更多的訓(xùn)練數(shù)據(jù)。
尤其重要的是,因?yàn)榫邆洹刚嬲?/p>
原文鏈接:全球首個自主進(jìn)化多模態(tài)MoE震撼登場!寫真視頻擊敗Sora,人大系團(tuán)隊(duì)自研底座VDT
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對人類社會與文明進(jìn)化的影響,領(lǐng)航中國新智能時代。