位于硅谷的非营利组织OpenAI的研究人员开发了一个机器人系统,称为“Dactyl”。它使用了一个来自英国公司称为“影子”的现成的机器手,一个普通的相机,以及一个已经掌握了一个庞大的多人在线视频游戏的DotA算法,它使用了同样的自学方法,即使用了一种称为强化学习的机器学习技术。Dactyl的任务是操纵一个立方体,把不同的面翻到上面来。通过不断的试错,来达到预期结果。
Dactyl AI的研究人员成功研究出一种自学算法,提高机器人的手的灵活性,使机器人的手能更加方便地操纵一个立方体,这个过程在计算机模拟中相当于进行了百年的练习,虽然在现实中只有几天时间。
其实机器人远不如我们想的那么“万能”,比如机器人的手就还远不及人类的敏捷,如果应用在工厂或仓库里就显得太过笨拙。即便如此,这项研究依然显示了机器还是拥有着学习与发展的潜力。若机器人有一天可以在虚拟世界中自学新技能,这将大大加快编程或训练它们的进程。
Dactyl自动地找出了人类常用的几个抓点,因此可以非常敏捷的操作旋转立方体。但在经过了“数百年”的虚拟训练之后,机器人成功地操纵了魔方的概率只有13/50,这比儿童所需要的时间还要长。必须要承认的是,人工智能还有很长的路要走。但这项研究依然是一件好事。
实际上,几十年前就提出了这种源于动物通过积极反馈学习方式的强化学习,但随着人工神经网络的进步,在最近几年才被证明是可行的。Alphabet旗下的DeepMind利用强化学习技术创建了AlphaGo。这是一个计算机程序,它学会的高超技能使其可以玩极其复杂和微妙的棋盘游戏。
对于这种方法其他机器人研究人员进行了一段时间的测试,但由于现实世界的不可预测性和复杂性,其模仿过程困难重重。OpenAI的研究人员通过在虚拟世界中引入随机变量来解决这个问题,这样机器人就可以学习如何解释诸如摩擦、机器人硬件噪音以及立方体部分处于视线之外的问题。
为了可以提高Dactyl的性能,制作该机器人工程师做了很多努力,比如通过赋予它更强的处理能力和引入更多的随机性。并且,这还仅仅是一个开始,工程师们认为机器人还没有达到极限,目前也没有将这项技术商业化的打算,而是专注于开发最强的通用学习方法。
密歇根大学专门研究机器操纵的专家Dmitry Berenson则认为这很难做好,因为目前还不清楚最新的机器学习方法将会带来多大影响。他们付出了很多努力来为特定的任务提供合适的方法。但他认为,模拟学习可能是非常有用的,如果我们能够真正地跨越“现实差距”,学习就会变得更加容易。
(内容来源:中译语通GTCOM综编/图片来源:网络)
| 留言与评论(共有 0 条评论) |