国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

把RLHF帶給VLA模型!通過偏好對齊來優化機器人策略,代碼已開源

AIGC動態9個月前發布 機器之心
508 0 0

本文將介紹如何通過偏好對齊來泛化機器人策略。

把RLHF帶給VLA模型!通過偏好對齊來優化機器人策略,代碼已開源

原標題:把RLHF帶給VLA模型!通過偏好對齊來優化機器人策略,代碼已開源
文章來源:機器之心
內容字數:4186字

GRAPE: 提升機器人策略泛化能力的偏好對齊框架

本文介紹了機器之心AIxiv專欄報道的最新研究成果——GRAPE (Generalizing Robot Policy via Preference Alignment) 框架。該研究由北卡羅來納大學教堂山分校張子健等學者完成,旨在解決視覺-語言-動作(VLA)模型在機器人任務中泛化能力不足的問題。

1. 研究背景與問題

現有的VLA模型通常依賴于對成功執行軌跡的行為克隆,導致其在面對新任務時泛化能力較差。此外,微調方法帶來的分布偏差也限制了模型對多樣化操作目標(例如效率、安全性)的適應能力。

2. GRAPE框架及其優勢

GRAPE是一個即插即用的算法,通過偏好對齊來提升VLA模型的泛化能力,并支持將模型對齊到任意設定的目標。它具有以下三大優勢:

  1. 軌跡級強化學習對齊:GRAPE在軌跡層面利用強化學習目標對VLA模型進行對齊,賦予模型全局決策能力,而非簡單的行為克隆。
  2. 隱式獎勵建模:GRAPE隱式建模了成功和失敗嘗試中的獎勵,提升了對多樣化任務的泛化能力。
  3. 可擴展的偏好合成算法:GRAPE采用可擴展的偏好合成算法,通過對軌跡進行排序,將VLA模型對齊到指定目標。

GRAPE框架包含三個主要部分:軌跡級偏好優化(Trajectory-wise Preference Optimization,TPO)、定制化偏好合成(Customized Preference Synthesis)和迭代式在線對齊(Iterative Online Alignment)。TPO通過改進的DPO損失函數(TPO_Loss)進行軌跡級別偏好學習;定制化偏好合成則利用大型視覺-語言模型分解復雜任務,自動引導偏好建模過程;迭代式在線對齊則通過循環迭代不斷優化對齊過程。

3. 實驗結果與分析

研究人員在真機和仿真環境下對GRAPE進行了評估。真機實驗涵蓋了五種分布外泛化(OOD)任務,結果顯示GRAPE相較于OpenVLA-SFT模型取得了顯著提升(20.7%~26.7%)。仿真實驗也驗證了GRAPE在面對不同OOD任務時的優越性能(8.0%~19.0%)。

此外,實驗還表明GRAPE能夠有效地將機器人策略與多種目標(如安全性、效率)對齊,例如,在追求安全性的目標下,碰撞率降低了44.31%;在追求效率的目標下,執行軌跡長度縮短了11.15%。

4. 結論

GRAPE框架是一種即插即用的VLA模型對齊方法,能夠顯著提升機器人策略的泛化能力,并支持對齊到任意指定目標,在多種機器人任務場景下均有應用潛力。


聯系作者

文章來源:機器之心
作者微信:
作者簡介:專業的人工智能媒體和產業服務平臺

閱讀原文
? 版權聲明
蟬鏡AI數字人

相關文章

蟬鏡AI數字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        日本韩国精品在线| 亚洲欧美日韩系列| 国产亚洲精品久| 亚洲人成网站色在线观看| 国产精品一区二区在线看| 久久国产日韩欧美精品| 欧美精品日日鲁夜夜添| 一级精品视频在线观看宜春院| 97国产一区二区| 国产精品中文字幕日韩精品| 亚洲免费伊人电影| 亚洲摸摸操操av| 亚洲男同性视频| 一区二区三区中文免费| 亚洲超碰97人人做人人爱| 亚洲午夜免费福利视频| 日韩电影在线免费看| 免费高清在线一区| 国产美女精品一区二区三区| 国产精品88av| 99精品视频在线观看| 色综合一区二区三区| 在线免费亚洲电影| 91精品国产高清一区二区三区| 日韩免费视频一区| 久久一留热品黄| 亚洲人成亚洲人成在线观看图片| 一卡二卡欧美日韩| 久久国产生活片100| 丁香婷婷综合网| 在线中文字幕不卡| 91精品国产综合久久久久| 精品美女在线观看| 国产精品久久久久一区二区三区共| 亚洲天堂2014| 三级一区在线视频先锋| 国产一区二区三区| 欧美专区亚洲专区| 欧美成人精品二区三区99精品| 国产亚洲精品免费| 亚洲与欧洲av电影| 国产在线播放一区二区三区| 99在线视频精品| 欧美日韩卡一卡二| 国产视频一区二区三区在线观看| 一区二区不卡在线播放| 国内国产精品久久| 在线免费观看视频一区| 2024国产精品视频| 亚洲一区二区三区四区五区中文| 激情偷乱视频一区二区三区| 一本大道综合伊人精品热热| 久久亚洲综合色一区二区三区| 亚洲手机成人高清视频| 蜜臀av性久久久久av蜜臀妖精| 成人av资源在线| 欧美一区二区免费| 亚洲精品国产第一综合99久久| 奇米影视在线99精品| 成人av免费观看| 精品成人一区二区| 午夜视频在线观看一区二区| 成人精品电影在线观看| 欧美v日韩v国产v| 亚洲va国产天堂va久久en| 成人午夜视频在线观看| 精品国产一区二区三区久久久蜜月 | 91精品久久久久久久久99蜜臂| 欧美韩日一区二区三区四区| 国产色婷婷亚洲99精品小说| 日本在线不卡视频一二三区| 色婷婷久久久亚洲一区二区三区| 久久久久国产精品人| 日产欧产美韩系列久久99| 色综合视频一区二区三区高清| 久久精品亚洲麻豆av一区二区| 免费在线观看一区| 欧美日韩高清在线播放| 亚洲一区二区三区不卡国产欧美| 99精品欧美一区二区蜜桃免费 | 麻豆国产精品一区二区三区| 一本色道亚洲精品aⅴ| 国产女人18水真多18精品一级做| 日本欧美一区二区三区乱码| 欧美日本免费一区二区三区| 亚洲一卡二卡三卡四卡无卡久久| av不卡一区二区三区| 中文字幕乱码久久午夜不卡 | 精一区二区三区| 欧美电影影音先锋| 日韩精品视频网站| 8v天堂国产在线一区二区| 午夜欧美一区二区三区在线播放 | 欧美精品九九99久久| 午夜伦欧美伦电影理论片| 欧美日韩一区二区三区四区 | 中文字幕欧美日韩一区| 国产白丝网站精品污在线入口| 国产亚洲综合在线| 成人免费视频免费观看| 最新高清无码专区| 欧美午夜寂寞影院| 青青青伊人色综合久久| 精品国产伦一区二区三区观看方式| 蜜臀久久99精品久久久久久9| 日韩欧美视频一区| 国产成人亚洲综合a∨婷婷图片| 久久精品视频在线免费观看| 成人h精品动漫一区二区三区| 亚洲精品中文字幕在线观看| 欧美日韩高清一区| 美腿丝袜亚洲三区| 久久精品亚洲精品国产欧美kt∨ | 色综合亚洲欧洲| 亚洲午夜一区二区三区| 日韩欧美在线123| 国产成人高清视频| 亚洲精品午夜久久久| 欧美精品久久99| 成人中文字幕在线| 亚洲国产精品久久久男人的天堂 | 国产91精品久久久久久久网曝门| 国产精品系列在线| 91精品国产综合久久精品麻豆| 国产一区美女在线| 亚洲动漫第一页| 国产女人水真多18毛片18精品视频| 色呦呦国产精品| 美女精品一区二区| 亚洲欧美一区二区三区极速播放 | 精品国产乱码久久久久久久| 91网站在线观看视频| 奇米色777欧美一区二区| 中文字幕av一区二区三区| 在线视频你懂得一区二区三区| 韩国欧美国产1区| 亚洲国产日韩在线一区模特| 久久先锋资源网| 欧美日韩综合在线| 成人av网站大全| 久久精品国产一区二区三区免费看| 国产精品久久午夜夜伦鲁鲁| 欧美精品一级二级| 色婷婷久久99综合精品jk白丝| 韩国成人福利片在线播放| 污片在线观看一区二区| 《视频一区视频二区| 久久精品夜夜夜夜久久| 日韩写真欧美这视频| 在线精品亚洲一区二区不卡| 成人在线综合网| 麻豆国产一区二区| 日韩电影免费在线观看网站| 亚洲色图在线视频| 亚洲国产成人在线| 精品国产免费视频| 日韩美女视频在线| 欧美精品v日韩精品v韩国精品v| 91美女蜜桃在线| 99精品欧美一区二区三区小说| 丰满白嫩尤物一区二区| 久久66热re国产| 久久精品国产成人一区二区三区 | 日韩欧美一区二区免费| 欧美性受极品xxxx喷水| 色综合天天综合网天天看片| 成人免费三级在线| av不卡免费电影| 成人ar影院免费观看视频| 国产黑丝在线一区二区三区| 韩国成人福利片在线播放| 国产揄拍国内精品对白| 国产美女一区二区| 国产精品一区免费在线观看| 国产在线播精品第三| 国产精品91一区二区| 高清不卡一二三区| 成人高清免费观看| www.日本不卡| 91官网在线免费观看| 欧美日韩国产综合一区二区三区 | 日韩一本二本av| 欧美tickling网站挠脚心| 精品久久久久久久人人人人传媒 | 一本大道久久a久久精品综合| 97久久精品人人澡人人爽| 99久久国产综合精品麻豆| 91在线免费视频观看| 在线观看免费亚洲| 欧美日韩和欧美的一区二区| 91精品国模一区二区三区| 精品99999| 国产精品理论在线观看| 亚洲综合在线免费观看| 三级精品在线观看| 狠狠色狠狠色综合系列| 成人av在线影院| 欧美亚洲国产一区二区三区va | 国产精品三级视频| 亚洲欧美一区二区三区久本道91 |