DeepCubeA深度强化学习算法解开魔方只需“一瞬间”

"\u003Cdiv\u003E\u003Cp\u003E自1974年一位匈牙利建筑师发明魔方以来,许多试图破解魔方的人都皱起了眉头,但这个三维逻辑难题无法与加州大学欧文分校(University of California, Irvine)的研究人员创造的人工智能系统相比。\u003C\u002Fp\u003E\u003Cp\u003E由UCIcomputer的科学家和数学家编写的一种深度强化学习算法DeepCubeA,无需任何特定的领域知识或人类的游戏指导,就能在瞬间找到解决方案。这不是一个简单的任务,因为立方体有数十亿条完成路径,但只有一个目标状态——每条边都显示纯色——显然无法通过随机移动找到。\u003C\u002Fp\u003E\u003Cp\u003E在《自然机器智能》(Nature Machine Intelligence)上发表的一项研究中,研究人员证明,DeepCubeA解决了100%的所有测试配置,在大约60%的时间里找到了通往目标状态的最短路径。该算法也适用于其他组合游戏,如滑动拼图、熄灯和Sokoban。\u003C\u002Fp\u003E\u003Cp\u003EUCI著名的计算机科学教授、资深作者皮埃尔•巴尔迪表示:“人工智能可以打败世界上最优秀的人类象棋和围棋选手,但一些难度更大的谜题,比如魔方,还没有被电脑破解,所以我们认为它们为人工智能方法打开了大门。”“魔方的解决方案包括更多的符号、数学和抽象思维,因此一台能够破解这样一个谜题的深度机器,正越来越接近成为一个能够思考、推理、计划和决策的系统。”\u003C\u002Fp\u003E\u003Cp\u003E研究人员感兴趣的是了解人工智能如何以及为什么会做出这些动作,以及需要多长时间来完善它的方法。他们先用电脑模拟出一个完整的谜题,然后把它打乱。一旦代码就位并运行,DeepCubeA就会在隔离状态下训练两天,解决一系列越来越难的组合。\u003C\u002Fp\u003E\u003Cp\u003E“它是自学成才的,”巴尔迪说。\u003C\u002Fp\u003E\u003Cp\u003E有些人,尤其是十几岁的孩子,可以很快地解出魔方,但即使他们也要走50步左右。\u003C\u002Fp\u003E\u003Cp\u003E“我们的人工智能需要走大约20步,大部分时间只用很少的几步就能解决问题,”巴尔迪说。“就在这里,你可以看到策略是不同的,所以我最好的猜测是,人工智能的推理形式与人类的完全不同。”\u003C\u002Fp\u003E\u003Cp\u003E这位资深计算机科学家表示,像这样的项目的最终目标是建造下一代人工智能系统。不管人们知不知道,人工智能每天都在通过Siri、Alexa等应用程序和推荐引擎在他们最喜欢的在线服务的后台运行,来打动他们。\u003C\u002Fp\u003E\u003Cp class=\"ql-align-center\"\u003E“但这些系统并不是真正的智能;它们很脆,你很容易就能把它们打碎或者骗过\u003Cspan\u003E它们。\u003C\u002Fspan\u003E”“我们如何创造出更智能、更健壮、更有推理、理解和规划能力的高级人工智能?”这项工作是朝着这个宏伟目标迈出的一步。”\u003C\u002Fp\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp1.pstatp.com\u002Flarge\u002Fpgc-image\u002Fc3b254d2a2b44d808814e5d49d55e19c\" img_width=\"800\" img_height=\"445\" alt=\"DeepCubeA深度强化学习算法解开魔方只需“一瞬间”\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003C\u002Fdiv\u003E"
发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();