首页
在现实世界中安全地学习运动技能
返回

在现实世界中安全地学习运动技能

2022-12-19 科技信息 By:佚名
最佳答案深度强化学习 (RL) 的最新进展能够解决机器人技术中复杂的高维问题。然而,有效地训练 RL 策略需要探索可能对机器人不安全的机器人状态和动作。因此,Google Research 最近的一篇论文介绍了一种 RL 框架,用于学习腿部运动,同时满足训练期间的安全约束。该框架由两个政策组成。“安全恢复策略...

深度强化学习 (RL) 的最新进展能够解决机器人技术中复杂的高维问题。然而,有效地训练 RL 策略需要探索可能对机器人不安全的机器人状态和动作。因此,Google Research 最近的一篇论文介绍了一种 RL 框架,用于学习腿部运动,同时满足训练期间的安全约束。

该框架由两个政策组成。“安全恢复策略”将机器人从接近不安全的状态中恢复,“学习者策略”执行所需的控制任务。该算法的有效性在三个运动任务上得到证明。对于高效的步态和走秀任务,实现了没有跌倒且无需手动重置的策略。

只用四次跌倒训练了一条两条腿的平衡任务。该论文表明,在现实世界中自主安全地学习腿部运动技能是可能的。

猜你喜欢
消费卡能刷个人POS机吗(消费卡)

消费卡能刷个人POS机吗(消费卡)

12-18 0 阅读
乐心手环使用说明书下载(乐心手环使用说明书)

乐心手环使用说明书下载(乐心手环使用说明书)

12-19 0 阅读
如何开导情绪不好的人(怎么开导心情不好的人)

如何开导情绪不好的人(怎么开导心情不好的人)

12-18 0 阅读
贝利亚尔头像(贝利亚尔)

贝利亚尔头像(贝利亚尔)

12-18 0 阅读
职业投资人李杰(职业投资人)

职业投资人李杰(职业投资人)

12-18 0 阅读
intel(g31及英特尔G31主板都支持那些CPU)

intel(g31及英特尔G31主板都支持那些CPU)

12-19 0 阅读
热门推荐
消费卡能刷个人POS机吗(消费卡)

消费卡能刷个人POS机吗(消费卡)

12-18 0 阅读
乐心手环使用说明书下载(乐心手环使用说明书)

乐心手环使用说明书下载(乐心手环使用说明书)

12-19 0 阅读
如何开导情绪不好的人(怎么开导心情不好的人)

如何开导情绪不好的人(怎么开导心情不好的人)

12-18 0 阅读
贝利亚尔头像(贝利亚尔)

贝利亚尔头像(贝利亚尔)

12-18 0 阅读
职业投资人李杰(职业投资人)

职业投资人李杰(职业投资人)

12-18 0 阅读
intel(g31及英特尔G31主板都支持那些CPU)

intel(g31及英特尔G31主板都支持那些CPU)

12-19 0 阅读
制造费用账户性质(账户性质)

制造费用账户性质(账户性质)

10-09 0 阅读
四分之三符号怎么打字(四分之三符号怎么打)

四分之三符号怎么打字(四分之三符号怎么打)

12-18 0 阅读
苗阿朵美食视频(阿朵露卫生巾)

苗阿朵美食视频(阿朵露卫生巾)

02-17 0 阅读
图片如何加水印文字(图片如何加水印)

图片如何加水印文字(图片如何加水印)

12-18 0 阅读