解剖Sora:37頁(yè)論文逆向工程推測(cè)技術(shù)細(xì)節(jié),微軟參與,華人團(tuán)隊(duì)出品
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:解剖Sora:37頁(yè)論文逆向工程推測(cè)技術(shù)細(xì)節(jié),微軟參與,華人團(tuán)隊(duì)出品
關(guān)鍵字:報(bào)告,視頻,模型,編碼器,視覺
文章來源:量子位
內(nèi)容字?jǐn)?shù):12694字
內(nèi)容摘要:
西風(fēng) 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAISora剛發(fā)布不久,就被逆向工程“解剖”了?!
來自理海大學(xué)、微軟研究院的華人團(tuán)隊(duì)發(fā)布了首個(gè)Sora相關(guān)研究綜述,足足有37頁(yè)。
他們基于Sora公開技術(shù)報(bào)告和逆向工程,對(duì)模型背景、相關(guān)技術(shù)、應(yīng)用、現(xiàn)存挑戰(zhàn)以及文本到視頻AI模型未來發(fā)展方向進(jìn)行了全面分析。
連計(jì)算機(jī)視覺領(lǐng)域的AI生成模型發(fā)展史、近兩年有代表性的視頻生成模型都羅列了出來:
網(wǎng)友們也屬實(shí)沒想到,僅僅過了半個(gè)月、Sora還暫未公開僅有部分人可使用,學(xué)術(shù)圈相關(guān)研究竟出現(xiàn)得這么快。
不少網(wǎng)友表示,綜述非常全面有條理,建議全文閱讀。
那么這篇綜述具體都講了啥?
量子位在不改變?cè)獾幕A(chǔ)上,對(duì)部分內(nèi)容進(jìn)行了整理。
目錄
逆向工程剖析Sora技術(shù)細(xì)節(jié)
整體架構(gòu)
多樣性視覺數(shù)據(jù)預(yù)處理
指令調(diào)優(yōu):視頻摘要生成器
視頻提示工程
Sora具有里程碑式意義
Sora的五大應(yīng)用前景及局限性
逆向工程剖析Sora技術(shù)細(xì)節(jié)眾所周知,Sora發(fā)布后,OpenAI緊接著發(fā)布了技術(shù)報(bào)告,但未詳細(xì)透露技術(shù)細(xì)節(jié),被有的網(wǎng)友吐槽OpenAI果然還是這么“Close”。
學(xué)術(shù)圈的猜測(cè)也是五花八門,ResNeXt一作
原文鏈接:解剖Sora:37頁(yè)論文逆向工程推測(cè)技術(shù)細(xì)節(jié),微軟參與,華人團(tuán)隊(duì)出品
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破