使用自适应深度强化学习卷曲的AI机器人

2021-01-11 15:02:20    来源:新经网    作者:阿威

在冰壶运动中,由于涉及的策略和精确度而被称为“冰上比赛”,一个名为Curly的机器人在四场正式比赛中的三场击败了韩国国家队。机器人当然已经走了很长一段路,但是它们仍然很笨拙,并且大多数都缺少人体的灵巧性。因此,掌握卷曲的机器人Curly令人印象深刻。

使用自适应深度强化学习卷曲的AI机器人

要充分欣赏这项技术的壮举,了解卷曲的运动很重要。冰壶运动需要保龄球的物理性,因为玩家将40磅重的石头从称为hogline的边界向下推到冰上,朝着100英尺远的目标滑下。石头的目标称为具有同心圆的房屋-越靠近目标,您得到的点就越多。

在冰壶比赛中,您与一个团队竞争,该团队的球员还试图将他们的花岗岩冰球扔向更靠近目标的位置,或将您的花岗岩冰球击倒以获取最多的积分。冰壶策略是要弄清楚如何通过将对手的石头撞到适当的位置上,同时将对手的石头撞到适当的位置,以使对手的石头在房屋中对准最佳位置。诀窍在于,石头和冰块的摩擦使比赛者所面对的元素在比赛中始终变化。冰壶对于人类来说并不是一件容易的事,对于一台机器而言也是一项令人难以置信的成就。

德国柏林理工学院的克劳斯-罗伯特·穆勒(Klaus-RobertMüller)和他的同事们是Curly创作的幕后功臣。Curly由人工智能驱动,特别是自适应深度强化学习框架。该机器人的前部有两个轮子,后部有一个脚轮。它有一个伸缩式摄像机,可以到达空中7英尺,以帮助机器人看到房子,并在前轮正上方找到另一个摄像机,以便它可以看到hogline。连同四个U形,由传送带驱动的较小的轮子,机器人用其前轮抓紧石头。U型轮使机器人能够旋转石头,使石头向右或向左旋转的卷曲是这项运动中的一项关键技术。

为了帮助Curly学习冰壶的策略,开发团队创建了一个冰壶游戏的仿真模型,Curly可以与之竞争并从中学习。模拟中具有挑战性的事情是每场比赛中不断变化的条件-冰况,石头的抛光和这项运动的其他物理性质。人类竞争者必须不断适应不断变化的条件。结果,模拟与现实之间存在差距。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。