机器人领域向前迈出了一步,紧随其后的又是另一步。最近,一个名为Rainbow Dash的机器人自学了走路。这只四脚机器只需要几个小时就可以学会向前和向后行走,并在此过程中左右旋转。
谷歌,加州大学伯克利分校和佐治亚理工学院的研究人员在ArXiv预印本服务器上发表了一篇论文,描述了一种统计AI技术,即深度强化学习,他们使用这种技术来获得这一成就,这是很重要的,原因有很多。
大多数强化学习部署都在计算机模拟的环境中进行。但是,Rainbow Dash使用此技术来学习在实际物理环境中行走。
而且,它能够在没有专门的教学机制的情况下做到这一点,例如人工指导或带有标签的培训数据。最终,Rainbow Dash成功地在多个表面上行走,包括柔软的泡沫床垫和带有明显凹口的门垫。
机器人使用的深度强化学习技术包括一种机器学习,其中代理与环境交互以通过反复试验来学习。大多数强化学习用例都涉及计算机游戏,其中数字特工学习如何玩赢。
这种形式的机器学习与传统的有监督或无监督学习明显不同,在传统的有监督或无监督学习中,机器学习模型需要标记的训练数据来学习。深度强化学习将强化学习方法与深度学习相结合,传统的机器学习的规模随着强大的计算能力而大大扩展。