AIGC動態歡迎閱讀
原標題:清華系出手,推出全面對標Sora的視頻大模型
關鍵字:視頻,字節跳動,模型,鏡頭,架構
文章來源:智東西
內容字數:5278字
內容摘要:
中國首個長時長、高一致性、高動態性視頻大模型Vidu發布。
作者|ZeR0
編輯|漠影
智東西4月27日報道,在今日舉行的2024中關村論壇人工智能主題日未來人工智能先鋒論壇上,清華大學教授、生數科技首席科學家朱軍宣布,生數科技與清華大合推出中國首個原創全自研長時長、高一致性、高動態性的視頻大模型Vidu。
根據公開融資信息,成立于去年3月的生數科技,是當前主要國內累計融資額及估值最高的類Sora創企,迄今已完成數億元融資,投資方包括百度風投、智譜AI、螞蟻集團以及創始成員多數來自于原字節跳動投資團隊的錦秋基金。
朱軍現場展示了Vidu與Pika、Gen-2、Sora等行業現有文生視頻大模型的生成視頻效果對比。他評價說,Vidu在16秒長期保持和語義理解等方面表現得非常突出。
▲使用相同提示詞,Vidu與Pika、Gen-2生成視頻對比
▲使用相同提示詞,Vidu與Sora生成視頻對比
▲Vidu生成視頻的部分動圖
Vidu能根據文本描述直接生成16秒高質量視頻,且生成視頻流暢連貫,沒有明顯的插幀現象。據介紹,這是因為Vidu采用的是“一步到位”的生成方式,與Sora一樣,文本到視
聯系作者
文章來源:智東西
作者微信:zhidxcom
作者簡介:智能產業新媒體!智東西專注報道人工智能主導的前沿技術發展,和技術應用帶來的千行百業產業升級。聚焦智能變革,服務產業升級。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...