標(biāo)簽：視頻

翻車，才是斯坦福炒菜機(jī)器人學(xué)習(xí)人類的常態(tài)

機(jī)器之心報(bào)道作者：大盤雞、陳萍Mobile ALOHA也有翻車時(shí)刻。電視劇中角色的驚艷亮相不一定能打動(dòng)你的心，但斯坦福全職管家兼御用大廚一定能拿下你對(duì)機(jī)器人...

2年前 (2024)

Pika一鍵生成3秒視頻，夠做一個(gè)表情包

大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自AI科技評(píng)論作者：曉龍省流：Pika是一款文字生成視頻的AI模型，可輸入文字、上傳圖片乃至錄制視頻后再通過(guò)AI進(jìn)一步生成一個(gè)新的視頻。...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

Pika 一鍵生成 3 秒視頻，夠做一個(gè)表情包

省流：Pika是一款文字生成視頻的AI模型，可輸入文字、上傳圖片乃至錄制視頻后再通過(guò)AI進(jìn)一步生成一個(gè)新的視頻。在2023年11月，Pika開放端口在Discord進(jìn)行測(cè)試...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

AI解讀視頻張口就來(lái)？這種「幻覺」難題Vista-LLaMA給解決了

機(jī)器之心專欄機(jī)器之心編輯部Vista-LLaMA 在處理長(zhǎng)視頻內(nèi)容方面的顯著優(yōu)勢(shì)，為視頻分析領(lǐng)域帶來(lái)了新的解決框架。近年來(lái)，大型語(yǔ)言模型如 GPT、GLM 和 LLaMA ...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

斯坦福爆火機(jī)器人失敗！炒蝦做家務(wù)逗貓都是人類遙控的，AI廚師和女仆還很遙遠(yuǎn)

夕小瑤科技說(shuō) 原創(chuàng)作者 | 王二狗大家好，我是二狗。這兩天，想必大家都看到了斯坦福華人團(tuán)隊(duì)的 ALOHA 機(jī)器人爆火網(wǎng)絡(luò)。既能炒蝦仁滑蛋、干貝燒雞和耗油生菜...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

新加坡國(guó)立大學(xué)發(fā)布圖文預(yù)訓(xùn)練框架 CosMo，助力長(zhǎng)文本理解

夕小瑤科技說(shuō) 原創(chuàng)作者 | 智商掉了一地、Python近年來(lái)，隨著大型語(yǔ)言模型（LLM）的興起，讓多模態(tài)學(xué)習(xí)領(lǐng)域也得到了不斷發(fā)展。本文作者深入探討了視覺-語(yǔ)言預(yù)...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

無(wú)需文本標(biāo)注，TF-T2V把AI量產(chǎn)視頻的成本打下來(lái)了！華科阿里等聯(lián)合打造

機(jī)器之心專欄機(jī)器之心編輯部在過(guò)去短短兩年內(nèi)，隨著諸如LAION-5B 等大規(guī)模圖文數(shù)據(jù)集的開放，Stable Diffusion、DALL-E 2、ControlNet、Composer ，效果驚人...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

大翻車！斯坦福超火機(jī)器人自曝，研究者救場(chǎng)還受傷了，網(wǎng)友：放心了

金磊豐色發(fā)自凹非寺量子位 | 公眾號(hào) QbitAI爆火的斯坦福全能家務(wù)機(jī)器人Mobile ALOHA，大！翻！！車！！！你以為它擦個(gè)紅酒輕而易舉，但實(shí)際上卻是這樣的...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

一句話精準(zhǔn)視頻片段定位！清華新方法拿下SOTA｜已開源

陳厚倫投稿量子位 | 公眾號(hào) QbitAI只需一句話描述，就能在一大段視頻中定位到對(duì)應(yīng)片段！比如描述“一個(gè)人一邊下樓梯一邊喝水”，通過(guò)視頻畫面和腳步聲的匹配...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

因?yàn)樗R斯克和兵馬俑都跳起了《科目三》

一張照片就能讓馬斯克、梅西等各大名人魔性跳舞，甚至連火爆全網(wǎng)的科目三都能安排上。這可不是什么高深 AI 技術(shù)，阿里通義千問(wèn)移動(dòng)端新增的「全民舞王」功能...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

兵馬俑跳《科目三》，是我萬(wàn)萬(wàn)沒(méi)想到的

金磊發(fā)自凹非寺量子位 | 公眾號(hào) QbitAI家人們，火爆全球的魔性舞蹈《科目三》，誰(shuí)能料到，就連兵馬俑也開始跳上了！熱度還居高不下，瞬間被轟上了熱搜，小...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

馬斯克也逃不過(guò)「科目三」，阿里這個(gè)應(yīng)用都要把外國(guó)人饞哭了

機(jī)器之心原創(chuàng) 作者：陳萍、大盤雞阿里開年整新活了。最近，不少社交平臺(tái)都被一種名為「科目三」的舞蹈視頻刷屏了，搖花手、半崴不崴的腳，配合著節(jié)奏鮮明的音...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

短劇時(shí)代即將來(lái)臨？AI自動(dòng)生成劇本和多場(chǎng)景長(zhǎng)視頻

大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自將門創(chuàng)投作者：HiDream.ai 近年來(lái)隨著擴(kuò)散模型（diffusion models）的進(jìn)步和發(fā)展，給定文本提示進(jìn)行高質(zhì)量視頻生成技術(shù)有著顯著的提升...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

Meta清華校友推全新AI「視頻生視頻」方法！單張A100生成「男人秒變猩猩」大片

新智元報(bào)道編輯：編輯部【新智元導(dǎo)讀】今年，會(huì)不會(huì)是AI視頻生成模型的元年？UT Austin聯(lián)手Meta團(tuán)隊(duì)提出了一個(gè)全新V2V模型FlowVid，能夠在1.5分鐘內(nèi)生成4秒...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

文生視頻下一站，Meta已經(jīng)開始視頻生視頻了

機(jī)器之心報(bào)道編輯：小舟、大盤雞? 文本指導(dǎo)的視頻到視頻（V2V）合成在各個(gè)領(lǐng)域具有廣泛的應(yīng)用，例如短視頻創(chuàng)作以及更廣泛的電影行業(yè)。擴(kuò)散模型已經(jīng)改變了圖...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

1…43 444546 47…54