AIGC動態歡迎閱讀
原標題:徐圖智能徐東:文生視頻創業,要用堅定信仰對抗 fomo 的大廠
關鍵字:視頻,模型,快手,科技,報告
文章來源:AI科技評論
內容字數:0字
內容摘要:
不開源,文生視頻模型仍是,而不是茶葉蛋。作者丨王悅
編輯丨陳彩嫻
在 GPT-4 發布一年多后,OpenAI 推出 GPT-4o,是有史以來第一個真正實現「多模態輸入—多模態輸出」的多模態模型。
GPT-4o 的出現所傳遞的信息是:在底層模型并沒有變得更智能的情況下,能夠跨多種模態進行推理的模型必然是更加通用的。因為其不僅具備多種功能,還能以不同模態傳遞知識。
雖然具備了強大的多模態能力, 但 GPT-4o 目前只可以接受文本、音頻和圖像/視頻數據的任意組合作為輸入,并生成文本、音頻和圖像作為輸出,其中尚未涉及視頻生成這一部分。其實,這也側面證明了,視頻生成是難啃的一塊骨頭。
即使是主打視頻生成能力的 Sora 在今年發布后也尚未對外開放使用,其真正的技術穩定性仍然存疑,而國內則是處在悶頭追趕 Sora 的技術研發期,各文生視頻創業公司亦是把戰力值加滿,想在短暫的窗口期融到更多的錢來盡快在幾個月內追趕上 Sora 的腳步。
「三個月內對齊到 Sora 的視頻生成效果還是很難的,和 Sora 相比大家都還是在一個相對低的起跑線上,這樣是個長期發力、急不得的事。」香港大學教授、歐洲科
原文鏈接:徐圖智能徐東:文生視頻創業,要用堅定信仰對抗 fomo 的大廠
聯系作者
文章來源:AI科技評論
作者微信:aitechtalk
作者簡介:雷峰網旗下AI新媒體。聚焦AI前沿研究,關注AI工程落地。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...