清華大學(xué)研究團(tuán)隊(duì)榮膺X-Embodiment最佳論文獎(jiǎng),CoRL 2024機(jī)器人頂會(huì)獲獎(jiǎng)名單震撼揭曉!
清華大學(xué)高陽(yáng)團(tuán)隊(duì)榮獲CoRL 2024X-Embodiment Workshop最佳論文獎(jiǎng)。
原標(biāo)題:清華大學(xué)獲X-Embodiment最佳論文獎(jiǎng),機(jī)器人頂會(huì)CoRL 2024獲獎(jiǎng)名單出爐
文章來源:AI科技評(píng)論
內(nèi)容字?jǐn)?shù):6335字
清華大學(xué)高陽(yáng)團(tuán)隊(duì)榮獲CoRL 2024最佳論文獎(jiǎng)
在最新一屆機(jī)器人頂級(jí)會(huì)議CoRL 2024(Conference on Robot Learning)中,來自清華大學(xué)的高陽(yáng)團(tuán)隊(duì)榮獲X-Embodiment Workshop最佳論文獎(jiǎng)。他們的論文《Data Scaling Laws in Imitation Learning for Robotic Manipulation》探討了數(shù)據(jù)規(guī)模定律在機(jī)器人操作中的模仿學(xué)習(xí)應(yīng)用,尤其是如何通過適當(dāng)?shù)臄?shù)據(jù)規(guī)模實(shí)現(xiàn)零樣本泛化。
研究背景與方法
研究團(tuán)隊(duì)收集了超過40,000次人類演示,并進(jìn)行了15,000多次實(shí)際機(jī)器人操作。他們發(fā)現(xiàn),策略的泛化能力主要依賴于環(huán)境和對(duì)象的多樣性,而不是單純的演示數(shù)量。在此基礎(chǔ)上,團(tuán)隊(duì)設(shè)計(jì)了一種高效的數(shù)據(jù)收集方案,僅需四個(gè)采集者在一個(gè)下午就能獲取足夠的數(shù)據(jù),使兩個(gè)任務(wù)在新環(huán)境和新對(duì)象上的成功率達(dá)到約90%。
實(shí)驗(yàn)設(shè)計(jì)
研究團(tuán)隊(duì)選擇使用手持夾持器(UMI)在不同環(huán)境中收集人類演示數(shù)據(jù),并采用擴(kuò)散策略(Diffusion Policy)對(duì)數(shù)據(jù)進(jìn)行建模。實(shí)驗(yàn)任務(wù)包括Pour Water(倒水)和Mouse Arrangement(鼠標(biāo)移動(dòng)),并擴(kuò)展到Fold Towels(疊毛巾)和Unplug Charger(拔掉充電器)。實(shí)驗(yàn)結(jié)果表明,策略的泛化能力與訓(xùn)練環(huán)境和對(duì)象的數(shù)量密切相關(guān),符合冪律分布。
研究結(jié)果
實(shí)驗(yàn)顯示,隨著訓(xùn)練物體和環(huán)境數(shù)量的增加,策略在未見物體和環(huán)境上的表現(xiàn)顯著提高。特別是當(dāng)訓(xùn)練物體數(shù)量達(dá)到32時(shí),策略在未見物體上的表現(xiàn)超過0.9。這表明同時(shí)擴(kuò)展環(huán)境和物體數(shù)量的效果更佳,并且額外的演示對(duì)性能的提升效果逐漸飽和。
團(tuán)隊(duì)成員介紹
論文的主要作者包括高陽(yáng)教授和他的學(xué)生林凡淇、胡英東、盛平岳、Chuan Wen及游嘉誠(chéng)。林凡淇及胡英東分別為博士生,研究重點(diǎn)為具身智能,旨在實(shí)現(xiàn)機(jī)器人在人類水平操作能力上的突破。
最佳論文獎(jiǎng)及其他獲獎(jiǎng)?wù)撐?/h3>
在CoRL 2024中,除了清華團(tuán)隊(duì)的獲獎(jiǎng)?wù)撐耐猓琄uo-Hao Zeng等人的《PoliFormer: Scaling On-Policy RL with Transformers Results in Masterful Navigators》和Franck Djeumou等人的《One Model to Drift Them All》也獲得最佳論文獎(jiǎng)。這些研究展示了在機(jī)器人學(xué)習(xí)和自動(dòng)駕駛領(lǐng)域的最新成果和技術(shù)進(jìn)步。
聯(lián)系作者
文章來源:AI科技評(píng)論
作者微信:
作者簡(jiǎn)介:雷峰網(wǎng)旗下AI新媒體。聚焦AI前沿研究,關(guān)注AI工程落地。