標(biāo)簽:動作

CVPR 2024 | 面部+肢體動畫,一個(gè)框架搞定從音頻生成數(shù)字人表情與動作

機(jī)器之心專欄 機(jī)器之心編輯部AI 數(shù)字人面部與肢體的驅(qū)動算法作為數(shù)字人研發(fā)的重要環(huán)節(jié),可以大幅度降低 VR Chat、虛擬直播和游戲 NPC 等領(lǐng)域中的驅(qū)動成本。 ...
閱讀原文

今日arXiv最熱NLP大模型論文:微軟重磅:AgentAI,下一代人工智能的關(guān)鍵

夕小瑤科技說 原創(chuàng)作者 | Tscom 引言:AI的全面智能之路人工智能的發(fā)展已從簡單算法進(jìn)化到復(fù)雜的大型基礎(chǔ)模型,尤其在理解開放世界環(huán)境中的感官信息方面取得...
閱讀原文

升級!Sora漫步街頭的女人可以跳舞啦!科目三蹦迪多種舞姿停不下來,可精準(zhǔn)控制動作

夕小瑤科技說 原創(chuàng)作者 | 付奶茶Sora為我們展開了一個(gè)充滿驚喜的新篇章,同時(shí),Viggle這一模型也吸引了公眾的目光,并在推特上迅速走紅! 想象一個(gè)場景,你僅...
閱讀原文

長時(shí)舞蹈生成:數(shù)秒鐘可生成極長的3D舞蹈

大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自將門創(chuàng)投 針對目前音樂生成3D舞蹈動作中存在的長序列生成動作質(zhì)量差,生成效率低的問題,本文提出了Lodge,可以高效地根據(jù)輸入音樂生成...
閱讀原文

谷歌發(fā)布“Vlogger”模型:單張圖片生成10秒視頻

豐色 發(fā)自 凹非寺量子位 | 公眾號 QbitAI谷歌發(fā)布了一個(gè)新的視頻框架: 只需要一張你的頭像、一段講話錄音,就能得到一個(gè)本人栩栩如生的演講視頻。視頻時(shí)長可...
閱讀原文

拖拽P圖技術(shù)又升級了:StableDrag更穩(wěn)、更準(zhǔn),南大、騰訊聯(lián)合打造

機(jī)器之心報(bào)道 編輯:杜偉、陳萍去年 5 月,動動鼠標(biāo)就能讓圖片變「活」得研究 DragGAN 吸引了 AI 圈的關(guān)注。通過拖拽,我們可以改變并合成自己想要的圖像,比...
閱讀原文

國內(nèi)創(chuàng)業(yè)者和投資人如何看待 Figure 01 機(jī)器人:距離具身智能還有多遠(yuǎn)?

3 月 13 日,F(xiàn)igure 發(fā)布了和 OpenAI 合作后的首個(gè)機(jī)器人 Figure 01 的演示:視頻中,F(xiàn)igure 的人形機(jī)器人,可以完全與人類流暢對話,理解人類的意圖,同時(shí)還...
閱讀原文

開源版OpenAI機(jī)器人2.5萬打造!斯坦福李飛飛團(tuán)隊(duì)祭出「靈巧手」,泡茶剪紙炫技

新智元報(bào)道編輯:編輯部 【新智元導(dǎo)讀】「OpenAI機(jī)器人」一出世驚艷眾人!最近,李飛飛團(tuán)隊(duì)打造了一個(gè)開源便攜式手部動捕系統(tǒng)——DexCap,成本僅3600美元,就能...
閱讀原文

OpenAI機(jī)器人活了!說話做事太像人,2分半視頻震撼世界

OpenAI機(jī)器人來了,說話竟然會“結(jié)巴”,AI負(fù)責(zé)人深度拆解背后技術(shù)。 作者|云鵬 編輯|李水青 OpenAI大模型加持,F(xiàn)igure機(jī)器人再次顛覆了我們的想象! ▲測試員說...
閱讀原文

OpenAI大模型上身機(jī)器人,原速演示炸場!

編輯部 發(fā)自 凹非寺量子位 | 公眾號 QbitAIOpenAI大模型加持的機(jī)器人,深夜來襲! 名曰Figure 01,它能聽會說,動作靈活。 能和人類描述眼前看到的一切: 我...
閱讀原文

用Vision Pro實(shí)時(shí)訓(xùn)練機(jī)器狗!MIT博士生開源項(xiàng)目火了

魚羊 發(fā)自 凹非寺量子位 | 公眾號 QbitAIVision Pro又現(xiàn)火爆新玩法,這回還和具身智能聯(lián)動了~ 就像這樣,MIT小哥利用Vision Pro的手部追蹤功能,成功實(shí)現(xiàn)了對...
閱讀原文

馬斯克人形機(jī)器人2年4迭代的秘密找到了

大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自機(jī)器人大講堂 作者:Jack 2024年,機(jī)器人已經(jīng)朝著更像人邁出了一大步,斯坦福大學(xué)團(tuán)隊(duì)與谷歌DeepMind團(tuán)隊(duì)合作研發(fā)的能炒菜、能做家務(wù)的...
閱讀原文

今日arXiv最熱大模型論文:北京大學(xué)發(fā)布,將試錯引入大模型代理學(xué)習(xí)!

夕小瑤科技說 原創(chuàng)編輯 | 松果引言:探索語言智能的新邊界在人工智能的發(fā)展歷程中,語言智能始終是一個(gè)核心的研究領(lǐng)域。隨著大語言模型(LLM)的興起,我們對...
閱讀原文

外媒實(shí)測Sora,10秒視頻大翻車!阿里AI新作讓“高啟強(qiáng)變羅翔”

大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自頭部科技 文丨Congerry Sora 離正式開放應(yīng)該還有一段時(shí)間,但是外媒已經(jīng)提前體驗(yàn)上了! 近日,彭博社記者 Rachel Metz 親自體驗(yàn)了還在開...
閱讀原文

大一統(tǒng)視頻編輯框架:浙大&微軟推出UniEdit,無須訓(xùn)練、支持多種編輯場景

機(jī)器之心專欄 機(jī)器之心編輯部隨著 Sora 的爆火,人們看到了 AI 視頻生成的巨大潛力,對這一領(lǐng)域的關(guān)注度也越來越高。 除了視頻生成,在現(xiàn)實(shí)生活中,如何對視...
閱讀原文