AIGC動態歡迎閱讀
原標題:視頻生成模型變身智能體:斯坦福Percy Liang等提出VideoAgent,竟能自我優化
關鍵字:視頻,模型,反饋,報告,成功率
文章來源:機器之心
內容字數:0字
內容摘要:
機器之心報道
編輯:Panda現在正是「文本生視頻」賽道百花齊放的時代,而且其應用場景非常多,比如生成創意視頻內容、創建游戲場景、制作動畫和電影。甚至有研究表明還能將視頻生成用作真實世界的模擬器,比如 OpenAI 今年初就發布過一份將視頻生成模型作為世界模擬器的技術報告,參閱機器之心報道《我在模擬世界!OpenAI 剛剛公布 Sora 技術細節:是數據驅動物理引擎》。
文本生視頻模型的這些近期應用既有望實現互聯網規模級別的知識遷移(比如從生類視頻到生成機器人視頻),也有望打通實現通用智能體的道路(比如用單個策略控制不同環境中不同形態的機器人來執行多種多樣的任務)。
然而,現實情況是,文本生視頻模型的下游應用還很有限,原因包括幻覺問題以及生成的視頻內容不符合現實物理機制等。
雖然理論上可以通過擴大數據集和模型大小來有效減輕這些問題,但對視頻生成模型來說,這會很困難。
部分原因是標注和整理視頻的人力成本很高。另外,視頻生成方面還沒有一個非常適合大規模擴展的架構。
除了擴大規模,LLM 領域的另一個重要突破是能整合外部反饋來提升生成質量。那文本生視頻模型也能受益于這一思路嗎?
為了解答
原文鏈接:視頻生成模型變身智能體:斯坦福Percy Liang等提出VideoAgent,竟能自我優化
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...