Sora完整能力曝光!多模態(tài)視頻理解或成為下次爆點(diǎn)
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:Sora完整能力曝光!多模態(tài)視頻理解或成為下次爆點(diǎn)
關(guān)鍵字:商標(biāo)注冊,模型,視頻,能力,圖像
文章來源:夕小瑤科技說
內(nèi)容字?jǐn)?shù):1063字
內(nèi)容摘要:
夕小瑤科技說 原創(chuàng)作者 | 王二狗大家好我是二狗。
就在今天,據(jù)大V“小互”分享,Sora的完整能力曝光,根據(jù)OpenAI 申請的SORA?商標(biāo)注冊描述顯示:
除了眾所周知文生圖和文生視頻之外,Sora還具備多模態(tài)圖像視頻理解能力——
對視頻和圖像進(jìn)行識(shí)別、處理、分析、理解。
下面是SORA?商標(biāo)注冊描述截圖:
OpenAI 總是處處搶先一步Sora 模型文生視頻的強(qiáng)大,大家都見識(shí)到了。
下面是 Sora 模型生成的鮮花老虎漫天飛舞的視頻。
而這次 Sora 模型暴露出來的多模態(tài)圖像視頻理解能力就很值得人玩味。
畢竟此前幾天,Sora 模型正是在谷歌發(fā)布擁有多模態(tài)視頻理解能力的Gemini 1.5之后幾個(gè)小時(shí)才發(fā)布的。
Sora 模型的多模態(tài)視頻理解或成為下次爆點(diǎn)。
同時(shí)這正是 OpenAI 的宣發(fā)理念——?dú)馑缹κ郑肋h(yuǎn)用戶心智。
前幾日,據(jù)昆侖萬維創(chuàng)始人周亞輝劇透,OpenAI將很快發(fā)布GPT4.5,而且估計(jì)會(huì)故意選擇 Anthropic 發(fā)布Claude 3的時(shí)候發(fā)布。
Sora模型離不開中國??就在OpenAI發(fā)布Sora 模型改變世界的時(shí)候。
在國內(nèi),竟然有報(bào)道稱Sor
原文鏈接:Sora完整能力曝光!多模態(tài)視頻理解或成為下次爆點(diǎn)
聯(lián)系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:更快的AI前沿,更深的行業(yè)洞見。聚集25萬AI一線開發(fā)者、互聯(lián)網(wǎng)中高管和機(jī)構(gòu)投資人。一線作者來自清北、國內(nèi)外頂級(jí)AI實(shí)驗(yàn)室和大廠,兼?zhèn)湫袠I(yè)嗅覺與報(bào)道深度。