DeepMind具身智能“足球員”登Science Robotics?封面

AIGC動態(tài)歡迎閱讀
原標(biāo)題:DeepMind具身智能“足球員”登Science Robotics?封面
關(guān)鍵字:機器人,策略,范式,環(huán)境,腳本
文章來源:大數(shù)據(jù)文摘
內(nèi)容字?jǐn)?shù):6155字
內(nèi)容摘要:
大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自機器人大講堂
近日,Google DeepMind發(fā)表了一項突破性的研究成果,該公司利用深度強化學(xué)習(xí)方法,成功訓(xùn)練出了一個能夠在簡化版1v1足球比賽中靈活、高效進攻防守的“足球員”機器人。這一研究不僅讓雙足機器人在動作技能上有了大幅提升,更為開發(fā)通用智能體邁出了關(guān)鍵一步!相關(guān)研究論文以“Learning agile soccer skills for a bipedal robot with deep reinforcement learning”為題,以封面文章的形式已發(fā)表在 Science 子刊 Science Robotics 上。端到端強化學(xué)習(xí),掌握多項技能
與傳統(tǒng)的機器人控制方法不同,DeepMind采用了端到端的深度強化學(xué)習(xí)范式來訓(xùn)練機器人。這種方法不需要人工設(shè)計具體的動作指令,而是讓智能體通過不斷與環(huán)境互動、獲得獎勵反饋來自主學(xué)習(xí)最優(yōu)策略。
具體來說,研究人員將訓(xùn)練過程分為兩個階段。第一階段聚焦于基本技能的習(xí)得,包括從地面站立起身、在面對未經(jīng)訓(xùn)練的對手時進球得分等。第二階段則是在完整的1v1足球賽中綜合運用這些技能,并根據(jù)比賽形勢進一步
原文鏈接:DeepMind具身智能“足球員”登Science Robotics?封面
聯(lián)系作者
文章來源:大數(shù)據(jù)文摘
作者微信:BigDataDigest
作者簡介:普及數(shù)據(jù)思維,傳播數(shù)據(jù)文化

粵公網(wǎng)安備 44011502001135號