AIGC動態歡迎閱讀
原標題:國產地表最強視頻模型震驚歪果仁,官方現場搖人30s直出!視覺模型進入上下文時代
關鍵字:模型,主體,顯著特征,視頻,場景
文章來源:新智元
內容字數:0字
內容摘要:
新智元報道編輯:編輯部 HYZ
【新智元導讀】全球首個支持多主體一致性的多模態模型,剛剛誕生!Vidu 1.5一上線,全網網友都震驚了:LLM獨有的上下文學習優勢,視覺模型居然也有了。來自中國的視頻生成模型,再一次震驚了全球大模型圈。
生數科技推出的Vidu 1.5,成為世界首個支持多主體一致性的多模態模型!
上傳小哥、機甲、街景,接下來,就是見證奇跡的時刻。
人、物、環境,被天衣無縫地融合到了同一個視頻中,簡直令人驚嘆。
這種方法,顛覆了LoRA等傳統的單點微調方法,標志著視頻模型統一理解和生成的飛躍!
多模態人工智能,從此有了新標準。
與諸多漫長期貨的視頻模型不同,Vidu只要不到30s,就能生成一段視頻了!
外國友人直接原地驚掉下巴:機甲跟原圖一模一樣,這絕對是最穩定的視頻模型;有人更是言簡意賅地給出評價:生數科技是名副其實的游戲規則改變者。
只要上傳多個角色、物體和地點的圖片,就能立即生成每個物體一致的場景,人手制作一部大片的時代真的來了嗎?左右滑動查看踴躍的網友們,在評論區紛紛貼出了自己的腦洞素材。左右滑動查看而霸氣的官號直接在評論區隨機搖人,抽中的網友提供的素材,果然誕生
原文鏈接:國產地表最強視頻模型震驚歪果仁,官方現場搖人30s直出!視覺模型進入上下文時代
聯系作者
文章來源:新智元
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...