標(biāo)簽:視頻
翻車,才是斯坦福炒菜機(jī)器人學(xué)習(xí)人類的常態(tài)
機(jī)器之心報(bào)道 作者:大盤雞、陳萍Mobile ALOHA也有翻車時(shí)刻。 電視劇中角色的驚艷亮相不一定能打動(dòng)你的心,但斯坦福全職管家兼御用大廚一定能拿下你對(duì)機(jī)器人...
Pika一鍵生成3秒視頻,夠做一個(gè)表情包
大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自AI科技評(píng)論 作者:曉龍 省流:Pika是一款文字生成視頻的AI模型,可輸入文字、上傳圖片乃至錄制視頻后再通過(guò)AI進(jìn)一步生成一個(gè)新的視頻。...
Pika 一鍵生成 3 秒視頻,夠做一個(gè)表情包
省流:Pika是一款文字生成視頻的AI模型,可輸入文字、上傳圖片乃至錄制視頻后再通過(guò)AI進(jìn)一步生成一個(gè)新的視頻。在2023年11月,Pika開(kāi)放端口在Discord進(jìn)行測(cè)試...
AI解讀視頻張口就來(lái)?這種「幻覺(jué)」難題Vista-LLaMA給解決了
機(jī)器之心專欄 機(jī)器之心編輯部Vista-LLaMA 在處理長(zhǎng)視頻內(nèi)容方面的顯著優(yōu)勢(shì),為視頻分析領(lǐng)域帶來(lái)了新的解決框架。近年來(lái),大型語(yǔ)言模型如 GPT、GLM 和 LLaMA ...
斯坦福爆火機(jī)器人失敗!炒蝦做家務(wù)逗貓都是人類遙控的,AI廚師和女仆還很遙遠(yuǎn)
夕小瑤科技說(shuō) 原創(chuàng)作者 | 王二狗大家好,我是二狗。 這兩天,想必大家都看到了斯坦福華人團(tuán)隊(duì)的 ALOHA 機(jī)器人爆火網(wǎng)絡(luò)。 既能炒蝦仁滑蛋、干貝燒雞和耗油生菜...
新加坡國(guó)立大學(xué)發(fā)布圖文預(yù)訓(xùn)練框架 CosMo,助力長(zhǎng)文本理解
夕小瑤科技說(shuō) 原創(chuàng)作者 | 智商掉了一地、Python近年來(lái),隨著大型語(yǔ)言模型(LLM)的興起,讓多模態(tài)學(xué)習(xí)領(lǐng)域也得到了不斷發(fā)展。本文作者深入探討了視覺(jué)-語(yǔ)言預(yù)...
無(wú)需文本標(biāo)注,TF-T2V把AI量產(chǎn)視頻的成本打下來(lái)了!華科阿里等聯(lián)合打造
機(jī)器之心專欄 機(jī)器之心編輯部在過(guò)去短短兩年內(nèi),隨著諸如LAION-5B 等大規(guī)模圖文數(shù)據(jù)集的開(kāi)放,Stable Diffusion、DALL-E 2、ControlNet、Composer ,效果驚人...
一句話精準(zhǔn)視頻片段定位!清華新方法拿下SOTA|已開(kāi)源
陳厚倫 投稿量子位 | 公眾號(hào) QbitAI只需一句話描述,就能在一大段視頻中定位到對(duì)應(yīng)片段! 比如描述“一個(gè)人一邊下樓梯一邊喝水”,通過(guò)視頻畫面和腳步聲的匹配...
大翻車!斯坦福超火機(jī)器人自曝,研究者救場(chǎng)還受傷了,網(wǎng)友:放心了
金磊 豐色 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI爆火的斯坦福全能家務(wù)機(jī)器人Mobile ALOHA,大!翻!!車!!! 你以為它擦個(gè)紅酒輕而易舉,但實(shí)際上卻是這樣的...
因?yàn)樗R斯克和兵馬俑都跳起了《科目三》
一張照片就能讓馬斯克、梅西等各大名人魔性跳舞,甚至連火爆全網(wǎng)的科目三都能安排上。 這可不是什么高深 AI 技術(shù),阿里通義千問(wèn)移動(dòng)端新增的「全民舞王」功能...
兵馬俑跳《科目三》,是我萬(wàn)萬(wàn)沒(méi)想到的
金磊 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI家人們,火爆全球的魔性舞蹈《科目三》,誰(shuí)能料到,就連兵馬俑也開(kāi)始跳上了! 熱度還居高不下,瞬間被轟上了熱搜,小...
馬斯克也逃不過(guò)「科目三」,阿里這個(gè)應(yīng)用都要把外國(guó)人饞哭了
機(jī)器之心原創(chuàng) 作者:陳萍、大盤雞阿里開(kāi)年整新活了。最近,不少社交平臺(tái)都被一種名為「科目三」的舞蹈視頻刷屏了,搖花手、半崴不崴的腳,配合著節(jié)奏鮮明的音...
短劇時(shí)代即將來(lái)臨?AI自動(dòng)生成劇本和多場(chǎng)景長(zhǎng)視頻
大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自將門創(chuàng)投 作者:HiDream.ai 近年來(lái)隨著擴(kuò)散模型(diffusion models)的進(jìn)步和發(fā)展,給定文本提示進(jìn)行高質(zhì)量視頻生成技術(shù)有著顯著的提升...
Meta清華校友推全新AI「視頻生視頻」方法!單張A100生成「男人秒變猩猩」大片
新智元報(bào)道編輯:編輯部 【新智元導(dǎo)讀】今年,會(huì)不會(huì)是AI視頻生成模型的元年?UT Austin聯(lián)手Meta團(tuán)隊(duì)提出了一個(gè)全新V2V模型FlowVid,能夠在1.5分鐘內(nèi)生成4秒...
文生視頻下一站,Meta已經(jīng)開(kāi)始視頻生視頻了
機(jī)器之心報(bào)道 編輯:小舟、大盤雞? 文本指導(dǎo)的視頻到視頻(V2V)合成在各個(gè)領(lǐng)域具有廣泛的應(yīng)用,例如短視頻創(chuàng)作以及更廣泛的電影行業(yè)。擴(kuò)散模型已經(jīng)改變了圖...