DeepMind具身智能“足球員”登Science Robotics?封面
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:DeepMind具身智能“足球員”登Science Robotics?封面
關(guān)鍵字:機(jī)器人,策略,范式,環(huán)境,腳本
文章來(lái)源:大數(shù)據(jù)文摘
內(nèi)容字?jǐn)?shù):6155字
內(nèi)容摘要:
大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自機(jī)器人大講堂
近日,Google DeepMind發(fā)表了一項(xiàng)突破性的研究成果,該公司利用深度強(qiáng)化學(xué)習(xí)方法,成功訓(xùn)練出了一個(gè)能夠在簡(jiǎn)化版1v1足球比賽中靈活、高效進(jìn)攻防守的“足球員”機(jī)器人。這一研究不僅讓雙足機(jī)器人在動(dòng)作技能上有了大幅提升,更為開(kāi)發(fā)通用智能體邁出了關(guān)鍵一步!相關(guān)研究論文以“Learning agile soccer skills for a bipedal robot with deep reinforcement learning”為題,以封面文章的形式已發(fā)表在 Science 子刊 Science Robotics 上。端到端強(qiáng)化學(xué)習(xí),掌握多項(xiàng)技能
與傳統(tǒng)的機(jī)器人控制方法不同,DeepMind采用了端到端的深度強(qiáng)化學(xué)習(xí)范式來(lái)訓(xùn)練機(jī)器人。這種方法不需要人工設(shè)計(jì)具體的動(dòng)作指令,而是讓智能體通過(guò)不斷與環(huán)境互動(dòng)、獲得獎(jiǎng)勵(lì)反饋來(lái)自主學(xué)習(xí)最優(yōu)策略。
具體來(lái)說(shuō),研究人員將訓(xùn)練過(guò)程分為兩個(gè)階段。第一階段聚焦于基本技能的習(xí)得,包括從地面站立起身、在面對(duì)未經(jīng)訓(xùn)練的對(duì)手時(shí)進(jìn)球得分等。第二階段則是在完整的1v1足球賽中綜合運(yùn)用這些技能,并根據(jù)比賽形勢(shì)進(jìn)一步
原文鏈接:DeepMind具身智能“足球員”登Science Robotics?封面
聯(lián)系作者
文章來(lái)源:大數(shù)據(jù)文摘
作者微信:BigDataDigest
作者簡(jiǎn)介:普及數(shù)據(jù)思維,傳播數(shù)據(jù)文化