標簽:視頻
單圖就能解鎖全景視角!北大/港中文/騰訊等推出ViewCrafter | 已開源
ViewCrafter團隊 投稿量子位 | 公眾號 QbitAI隨便給張圖就能從更多視角查看全景了?! 話不多說,先看一波效果,單視角輸入be like:難度升級,接下來換成雙...
AI一鍵生成“類黑神話”!騰訊推出游戲視頻模型GameGen-O,業內人士:游戲工作室的ChatGPT時刻
一水 發自 凹非寺量子位 | 公眾號 QbitAI什么?大模型也許很快就能生成《黑神話·悟空》這種3A大作了?! 直接看一則demo,《西游記》這就上桌: 搭配BGM,是...
MMLU-Pro基準測試數據集上線,含 12k 個跨學科復雜問題,難度提升,更具挑戰性!DeepSeek 數學模型一鍵部署
在大語言模型 (LLM) 蓬勃發展的時代,諸如大規模多任務語言理解 (MMLU) 之類的基準測試,在推動 AI 于不同領域的語言理解與推理能力邁向極限方面,發揮著至關...
字節AI版小李子一開口:黃風嶺,八百里
叨樂 發自 凹非寺量子位 | 公眾號 QbitAI字節和浙大聯合研發的項目Loopy火了! 只需一幀圖像,一段音頻,就能生成一段非常自然的視頻! 研究團隊還放出了Loop...
音頻驅動人像視頻模型:字節Loopy、CyberHost研究成果揭秘
機器之心發布 機器之心編輯部近期,來自字節跳動的視頻生成模型 Loopy,一經發布就在 X 上引起了廣泛的討論。Loopy 可以僅僅通過一張圖片和一段音頻生成逼真...
小心!AI能「看懂」你的唇語,悄悄話不再安全!
叨樂 發自 凹非寺量子位 | 公眾號 QbitAI小心悄悄話被AI聽見!(噓) 最近國外一款可以讀唇語的AI軟件火了! 具體效果如下: 紅毯上布萊克·萊弗利小聲說:“好...
數據集匯總|DeepFake 亂象叢生,用魔法打敗魔法!高質量數據集助力偽造監測技術發展
作者:李姝 編輯:李姝 HyperAI超神經 (hyper.ai) 為大家匯總了常用的人臉識別、DeepFake 數據集,期望能在一定程度上幫助研究人員更有效地開展相關領域的研...
Vidu發布「主體參照」功能,有效解決視頻生成一致性問題
7 月份正式上線的國產視頻大模型 Vidu,在今天發布大版本更新。 在今天的生樹科技媒體開放日上,Vidu 發布了「主體參照」(Subject Consistency)功能,該功...
全球首發!Vidu 讓任意主體保持一致,視頻生成進入新階段!
上線一個月,Vidu 再度迎來重大更新! 4月底,由生數科技和清華大學聯合研發的國內首個純自研原創視頻大模型 Vidu 面向全球發布,7月底正式上線,全面開放使...
給我一張臉,視頻背景隨你換,林黛玉都被清華理工男玩廢了|免費開放
衡宇 發自 凹非寺量子位 | 公眾號 QbitAI讓AI視頻中任意主體保持一致!就在剛剛,人人都可輕松做到了。 而且只需一張圖片,就能實現。 ——上面的每一個馬斯克...
Sora陷研究泥潭?OpenAI一年血虧50億,高盛報告烏龍引AI股!
新智元報道編輯:編輯部 HYZ 【新智元導讀】剛剛,外媒曝出:Sora陷入了研究困境!背后原因,就是安全風險以及與好萊塢的合作。另外,最近高盛的報告錯誤解讀...
新AI編程工具爆火:手機2分鐘創建一個APP
金磊 發自 凹非寺量子位 | 公眾號 QbitAI繼Cursor之后,編程界又一新貴走紅。 它就是由AI初創公司Replit推出的智能體——Replit Agent。 有了它,現在編程這事...
Vision Pro 沉浸式視頻再上新,前 Google 技術專家揭秘背后獨特算法
VIsion Pro 沉浸式視頻 的背后Apple Vision Pro 的「殺手級」應用到底是什么? 網友制作的關于 VIsion Pro 的梗圖 這個問題從它誕生的那天起就一直不斷被提起...
ECCV 2024 | 比基準高30%,媲美Gemini 1.5 Pro,基于記憶的視頻理解智能體來了
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
MiniMax不藏了,大秀視頻/語音/文本全模態模型家族,“每天與世界交互30億次”
明敏 衡宇 發自 凹非寺量子位 | 公眾號 QbitAI終于,MiniMax不藏了。 首次正式公開亮相,最強大模型、最亮眼產品戰績,全部對外展示。 模型全家桶最新版齊上...