AIGC動態歡迎閱讀
原標題:被誤解的「中文版Sora」背后,字節跳動有哪些技術?
關鍵字:字節跳動,模型,視頻,圖像,研究者
文章來源:機器之心
內容字數:12381字
內容摘要:
機器之心報道
作者:蛋醬2024 開年,OpenAI 就在生成式 AI 領域扔下了重磅:Sora。
這幾年,視頻生成領域的技術迭代持續加速,很多科技公司也公布了相關技術進展和落地成果。在此之前,Pika、Runway 都曾推出過類似產品,但 Sora 放出的 Demo,顯然以一己之力抬高了視頻生成領域的標準。
在今后的這場競爭中,哪家公司將率先打造出超越 Sora 的產品,仍是未知數。
國內這邊,目光聚集于一眾科技大廠。
此前有消息稱,字節跳動在 Sora 發布之前就研發出了一款名為 Boximator 的視頻生成模型。
Boximator 提供了一種能夠精確控制視頻中物體的生成方法。用戶無需編寫復雜的文本提示,可以直接在參考圖像中通過在物體周圍畫方框來選擇目標,然后添加一些方框和線條來定義目標的結束位置或跨幀的整個路徑,如下圖所示:對此,字節跳動保持了低調的態度:相關人士回復媒體,Boximator 是視頻生成領域控制對象的技術方法研究項目。目前還無法作為完善的產品落地,距離國外領先的視頻生成模型在畫面質量、保真率、視頻時長等方面還有很大差距。
在對應的技術論文介紹(ht
原文鏈接:被誤解的「中文版Sora」背后,字節跳動有哪些技術?
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...