標簽:視頻

北大視頻大模型新SOTA,搞笑抖音視頻AI秒懂笑點|開源

夢晨 發自 凹非寺量子位 | 公眾號 QbitAIAI能理解搞笑視頻笑點在哪里了。AI回答:這個視頻之所以搞笑,在于一個小寶寶正坐在床上努力讀書,但他顯然還不會真...
閱讀原文

Meta生成式AI連放大招:視頻生成超越Gen-2,動圖表情包隨心定制

機器之心報道編輯:張倩、陳萍生成式 AI 進入視頻時代了。提到視頻生成,很多人首先想到的可能是 Gen-2、Pika Labs。但剛剛,Meta 宣布,他們的視頻生成效果...
閱讀原文

媲美Gen-2,Meta多模態創AI生圖新里程碑!破文生視頻歷史難題,靜圖秒變視頻逼真到炸裂

新智元報道編輯:編輯部【新智元導讀】文生視頻,直接被革命了!Meta連發兩個重磅研究,多模態模型Emu的變體 Emu Video和Emu Edit聯動解鎖生成式AI未來。就在...
閱讀原文

當韓國女團BLACKPINK進軍二次元,清華叉院AI神器原來還能這么玩

機器之心報道編輯:張倩看看這個 AI 生成的女團 MV 效果如何。如果你手機里有一些修圖軟件,你可能用過里面的「AI 繪畫」功能,它通常會提供一些把照片轉換為...
閱讀原文

微軟用GPT-4V解讀視頻,看懂電影還能講給盲人聽,1小時不是問題

機器之心報道編輯:Panda、陳萍差不多已經掌握語言能力的大模型正在進軍視覺領域,但具有里程碑意義的 GPT-4V 也仍有諸多不足之處,參閱《》。近日,微軟 Azu...
閱讀原文

浙大拿下唯一最佳論文獎,中國團隊喜獲三項大獎!ACM MultiMedia 2023獎項揭幕

新智元報道編輯:LRS【新智元導讀】ACM MM 2023上中國團隊獲三項大獎,多媒體領域再獲新突破。近日,2023 ACM MultiMedia會議落下帷幕,中國大陸團隊在這次國...
閱讀原文

多媒體頂會ACM Multimedia 2023各大獎項揭曉!浙大獲最佳論文,昆士蘭獲最佳學生論文

【導讀】第31屆ACM國際多媒體會議(ACM MM)于2023年10月29日至11月2日加拿大渥太華舉行。最佳論文,最佳學生論文,最佳demo, 最佳開源軟件在內的所有多媒體...
閱讀原文

Runway新功能「筆刷」再次驚艷AI圈:隨手一涂,圖片就動起來了

機器之心報道編輯:蛋醬網友:我都不敢想象一年后的視頻技術會有多先進。一段五十秒的預告視頻,再次讓 AI 圈沸騰了。昨日 Runway 宣布,即將在視頻生成工具 ...
閱讀原文

Runway 最強競品 Pika 1.0 預告來襲!文生視頻效果堪比迪士尼動畫!重新定義動畫生成新范式!

夕小瑤科技說 原創作者 |張雨霏、王二狗Runway是AI生成視頻賽道的絕對霸主嗎?不一定!就在這兩天天,Pika在推特上官宣——Pika 1.0即將來襲!話不多說,我們直...
閱讀原文

圖像涂哪就動哪!Gen-2新功能“神筆馬良”爆火,網友:急急急

蕭簫 發自 凹非寺量子位 | 公眾號 QbitAIAI搞視頻生成,已經進化到這個程度了?!對著一張照片隨手一刷,就能讓被選中的目標動起來!明明是一輛靜止的卡車,...
閱讀原文

“讓霉霉中文開口跪”的AI有開源平替了!每月立省350(doge)

豐色 發自 凹非寺量子位|公眾號QbitAI能、的那個AI——有開源平替了!這是用它讓羅翔進行英文普法的效果,張三李四“要素齊全”:以及英文講人生哲理“你的內心有...
閱讀原文

百度網盤變了!進化成學習神器:音視頻轉文稿、加字幕,還能一鍵生成PPT!

金磊 發自 凹非寺量子位 | 公眾號 QbitAI你絕對想不到現在最fashion的學習“姿勢”是什么——百度網盤!你以為只是拿它用來存儲課件、資料嗎?不不不,現在的百度...
閱讀原文

用語言對齊多模態信息,北大騰訊等提出LanguageBind,刷新多個榜單

機器之心專欄機器之心編輯部北京大學與騰訊等機構的研究者們提出了多模態對齊框架 ——LanguageBind。該框架在視頻、音頻、文本、深度圖和熱圖像等五種不同模態...
閱讀原文

AI的盡頭是美女,一句話生成你的專屬“新垣結衣”,“我被美女包圍”變為現實啦

這兩天你有沒有被steam一款游戲刷屏《完蛋!我被美女包圍了》《完蛋!我被美女包圍了》中的六位女主角在游戲中,玩家將扮演因創業失敗負債累累的“普男”,在到...
閱讀原文

10分鐘定制一個「陳天奇GPT」,OpenAI新品實測來襲!Sam Altman降維打擊,千家AI初創公司入土

新智元報道編輯:編輯部【新智元導讀】OpenAI引爆了核彈,讓任何人都可以使用自然語言在幾分鐘內構建應用程序!爆炸性的革命時刻,真的來了。OpenAI首屆春晚...
閱讀原文