使用自适应深度强化学习卷曲的AI机器人

2021-01-11 15:02:20 来源：新经网作者：阿威

在冰壶运动中，由于涉及的策略和精确度而被称为“冰上比赛”，一个名为Curly的机器人在四场正式比赛中的三场击败了韩国国家队。机器人当然已经走了很长一段路，但是它们仍然很笨拙，并且大多数都缺少人体的灵巧性。因此，掌握卷曲的机器人Curly令人印象深刻。

使用自适应深度强化学习卷曲的AI机器人

要充分欣赏这项技术的壮举，了解卷曲的运动很重要。冰壶运动需要保龄球的物理性，因为玩家将40磅重的石头从称为hogline的边界向下推到冰上，朝着100英尺远的目标滑下。石头的目标称为具有同心圆的房屋-越靠近目标，您得到的点就越多。

在冰壶比赛中，您与一个团队竞争，该团队的球员还试图将他们的花岗岩冰球扔向更靠近目标的位置，或将您的花岗岩冰球击倒以获取最多的积分。冰壶策略是要弄清楚如何通过将对手的石头撞到适当的位置上，同时将对手的石头撞到适当的位置，以使对手的石头在房屋中对准最佳位置。诀窍在于，石头和冰块的摩擦使比赛者所面对的元素在比赛中始终变化。冰壶对于人类来说并不是一件容易的事，对于一台机器而言也是一项令人难以置信的成就。

德国柏林理工学院的克劳斯-罗伯特·穆勒(Klaus-RobertMüller)和他的同事们是Curly创作的幕后功臣。Curly由人工智能驱动，特别是自适应深度强化学习框架。该机器人的前部有两个轮子，后部有一个脚轮。它有一个伸缩式摄像机，可以到达空中7英尺，以帮助机器人看到房子，并在前轮正上方找到另一个摄像机，以便它可以看到hogline。连同四个U形，由传送带驱动的较小的轮子，机器人用其前轮抓紧石头。U型轮使机器人能够旋转石头，使石头向右或向左旋转的卷曲是这项运动中的一项关键技术。

为了帮助Curly学习冰壶的策略，开发团队创建了一个冰壶游戏的仿真模型，Curly可以与之竞争并从中学习。模拟中具有挑战性的事情是每场比赛中不断变化的条件-冰况，石头的抛光和这项运动的其他物理性质。人类竞争者必须不断适应不断变化的条件。结果，模拟与现实之间存在差距。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

标签：人工智能 AI