中國如何復刻Sora,華人團隊長文解構(gòu)!996 OpenAI研究員:Sora是視頻GPT-2時刻
AIGC動態(tài)歡迎閱讀
原標題:中國如何復刻Sora,華人團隊長文解構(gòu)!996 OpenAI研究員:Sora是視頻GPT-2時刻
關(guān)鍵字:報告,視頻,模型,提示,視覺
文章來源:新智元
內(nèi)容字數(shù):14506字
內(nèi)容摘要:
新智元報道編輯:編輯部
【新智元導讀】自曝996作息的OpenAI研究員Jason Wei表示,Sora代表著視頻生成的GPT-2時刻。競爭的關(guān)鍵,就是算力和數(shù)據(jù)了。國內(nèi)有可能成功「復刻」Sora嗎?華人團隊的這份37頁技術(shù)報告,或許能給我們一些啟發(fā)。今天,這張圖在AI社區(qū)熱轉(zhuǎn)。
它列舉了一眾文生視頻模型的誕生時間、架構(gòu)和作者機構(gòu)。
毫不意外,谷歌依然是視頻模型開山之作的作者。不過如今AI視頻的聚光燈,全被Sora搶去了。
同時,自曝996作息時間表的OpenAI研究員Jason Wei表示——
「Sora是一個里程碑,代表著視頻生成的GPT-2時刻。」
對于文字生成領(lǐng)域,GPT-2無疑是一個分水嶺。2018年GPT-2的推出,標志著能夠生成連貫、語確的文本段落的新時代。
當然,GPT-2也難以完成一篇完整無誤的文章,會出現(xiàn)邏輯不一致或捏造事實的情況。但是,它為后續(xù)的模型發(fā)展奠定了基礎(chǔ)。
在不到五年內(nèi),GPT-4已經(jīng)能夠執(zhí)行串聯(lián)思維這種復雜任務,或者寫出一篇長文章,過程中并不會捏造事實。
而今天,Sora已經(jīng)也意味著這樣的時刻。
它能創(chuàng)作出既有藝術(shù)感又逼真的短視頻。雖然還不能創(chuàng)作
原文鏈接:中國如何復刻Sora,華人團隊長文解構(gòu)!996 OpenAI研究員:Sora是視頻GPT-2時刻
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀元。重點關(guān)注人工智能、機器人等前沿領(lǐng)域發(fā)展,關(guān)注人機融合、人工智能和機器人對人類社會與文明進化的影響,領(lǐng)航中國新智能時代。