<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        突破界限:智能體如何在未知人類設(shè)計環(huán)境中實現(xiàn)零樣本學(xué)習(xí)的性進(jìn)展

        AIGC動態(tài)10個月前發(fā)布 機(jī)器之心
        265 0 0

        能在2D物理環(huán)境中執(zhí)行多樣化任務(wù)了

        突破界限:智能體如何在未知人類設(shè)計環(huán)境中實現(xiàn)零樣本學(xué)習(xí)的革命性進(jìn)展

        原標(biāo)題:智能體零樣本解決未見過人類設(shè)計環(huán)境!全靠這個開放式物理RL環(huán)境空間
        文章來源:機(jī)器之心
        內(nèi)容字?jǐn)?shù):5768字

        1. 研究背景與目標(biāo)

        在機(jī)器學(xué)習(xí)領(lǐng)域,開發(fā)能夠在未見過領(lǐng)域表現(xiàn)出色的通用智能體一直是長期目標(biāo)之一。牛津大學(xué)的研究者們提出了Kinetix框架,旨在通過開放式物理控制任務(wù)訓(xùn)練通用智能體,推動其在2D物理環(huán)境中的應(yīng)用。

        2. Kinetix框架的特點

        Kinetix框架覆蓋范圍廣泛,可以表征多種任務(wù),包括機(jī)器人抓取、經(jīng)典RL環(huán)境(如Cartpole、Acrobot)、電子游戲等。為了支持Kinetix,研究者們開發(fā)了基于JAX的物理引擎Jax2D,能夠高效模擬數(shù)十億次環(huán)境交互。通過隨機(jī)采樣Kinetix環(huán)境,幾乎可以無限生成多樣化的訓(xùn)練任務(wù)。

        3. 動作與觀察空間

        Kinetix支持多離散和連續(xù)動作空間,并使用符號觀察表示每個實體的物理屬性。該觀察空間使環(huán)境完全可觀察,允許智能體在沒有記憶的情況下進(jìn)行策略學(xué)習(xí),并且支持基于像素的觀察選項。

        4. 獎勵機(jī)制與環(huán)境生成

        研究中選擇了簡單而表達(dá)力強(qiáng)的獎勵函數(shù),使綠色和藍(lán)色形狀發(fā)生碰撞時獲得+1獎勵,碰撞紅色形狀則獲得-1獎勵。此外,研究者提供了隨機(jī)級別生成器,以確保環(huán)境的多樣性并減少簡并情況的出現(xiàn)。

        5. 實驗結(jié)果與智能體性能

        研究者在Kinetix環(huán)境中訓(xùn)練的RL智能體表現(xiàn)出對一般機(jī)械特性的理解,并能夠零樣本解決未見過的手工環(huán)境。微調(diào)過程中,通用智能體的性能顯著提升,尤其在特定困難環(huán)境中,微調(diào)智能體能減少學(xué)習(xí)所需樣本數(shù)量,并解決專門訓(xùn)練過的智能體無法完成的任務(wù)。

        6. 總結(jié)與展望

        Kinetix的表現(xiàn)力和多樣性使其成為研究開放性、通用智能體和終身學(xué)習(xí)的理想環(huán)境。未來的研究可以進(jìn)一步探索Kinetix的潛力,以推動通用智能體在更廣泛和復(fù)雜環(huán)境中的應(yīng)用。


        聯(lián)系作者

        文章來源:機(jī)器之心
        作者微信:
        作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 182tv免费视频在线观看| 亚洲黄色激情视频| 国产精品黄页免费高清在线观看| 色婷婷7777免费视频在线观看| 亚洲色图黄色小说| 久久国产乱子伦免费精品| 久久精品国产亚洲AV香蕉| 亚洲免费一级视频| 精品久久久久久亚洲精品| 成年女人免费视频播放77777| 亚洲一区在线免费观看| 成人黄页网站免费观看大全 | 亚洲真人无码永久在线| 一级毛片在线免费视频| 国产精品V亚洲精品V日韩精品| 国产免费播放一区二区| 亚洲成av人在线视| 中文字幕免费视频| 涩涩色中文综合亚洲| 免费国产成人午夜私人影视| 一区二区在线免费视频| 亚洲bt加勒比一区二区| 无码国产精品一区二区免费式直播 | 精品日韩99亚洲的在线发布| 午夜毛片不卡免费观看视频| 免费无码国产V片在线观看| 亚洲中文字幕无码一区二区三区| 国产高清不卡免费视频| 久久狠狠爱亚洲综合影院| 国产精品另类激情久久久免费| 一级做a爰片久久免费| 久久精品亚洲中文字幕无码网站 | 男女超爽视频免费播放| 亚洲综合精品香蕉久久网| 222www免费视频| 亚洲欧美日韩中文高清www777| 亚洲av午夜成人片精品电影| 国产精品免费观看调教网| 亚洲成av人在线观看网站| 国产亚洲精品无码成人| 最新欧洲大片免费在线|