徐圖智能徐東：文生視頻創業，要用堅定信仰對抗 fomo 的大廠

AIGC動態2年前 (2024)發布 AI科技評論

AIGC動態歡迎閱讀

原標題：徐圖智能徐東：文生視頻創業，要用堅定信仰對抗 fomo 的大廠
關鍵字：視頻,模型,快手,科技,報告
文章來源：AI科技評論
內容字數：0字

內容摘要：

不開源，文生視頻模型仍是，而不是茶葉蛋。作者丨王悅
編輯丨陳彩嫻
在 GPT-4 發布一年多后，OpenAI 推出 GPT-4o，是有史以來第一個真正實現「多模態輸入—多模態輸出」的多模態模型。
GPT-4o 的出現所傳遞的信息是：在底層模型并沒有變得更智能的情況下，能夠跨多種模態進行推理的模型必然是更加通用的。因為其不僅具備多種功能，還能以不同模態傳遞知識。
雖然具備了強大的多模態能力，但 GPT-4o 目前只可以接受文本、音頻和圖像/視頻數據的任意組合作為輸入，并生成文本、音頻和圖像作為輸出，其中尚未涉及視頻生成這一部分。其實，這也側面證明了，視頻生成是難啃的一塊骨頭。
即使是主打視頻生成能力的 Sora 在今年發布后也尚未對外開放使用，其真正的技術穩定性仍然存疑，而國內則是處在悶頭追趕 Sora 的技術研發期，各文生視頻創業公司亦是把戰力值加滿，想在短暫的窗口期融到更多的錢來盡快在幾個月內追趕上 Sora 的腳步。
「三個月內對齊到 Sora 的視頻生成效果還是很難的，和 Sora 相比大家都還是在一個相對低的起跑線上，這樣是個長期發力、急不得的事。」香港大學教授、歐洲科

原文鏈接：徐圖智能徐東：文生視頻創業，要用堅定信仰對抗 fomo 的大廠