这项技术的重大突破,让机器人更像人类了!

当阿尔法狗打败韩国棋手李世石,大众对于人工智能的关注愈发高涨。有学者提出人工智能将会成为"第四次工业革命的驱动力"。机器人想要在智力上进一步接近人类,视觉无疑是需要跨过的重镇。

自然界中存在各种各样的眼睛,比如蜘蛛的八只眼睛。

比如蜻蜓的复眼:

而人类的眼睛是所有所有眼睛中综合性能最高的。如果将人类眼睛的各种功能都模拟出来,无疑将会成为人工智能的强劲助力。

机器人模拟人眼,困难在哪儿?

人类大脑获取信息的83%都来自视觉,眼睛就像是大脑延伸在人类外表的一部分。

我们每天使用眼睛,却很难发现它的强劲之处。每个眼睛能够单独成像,却又能完好的将整个图像呈现在人的眼前。不论是跑步还是跳跃,都能看清周围的事物。而且人眼自带3D立体成像功能,同时能感知自身在空间中的位置。

如果对比普通摄像头,是不是能很容易发现我们人眼的厉害之处?

结论就是:想要模拟人眼却不是一件容易的事情。

可是科研人员怎么会被困难打败呢?

张晓林教授带领的团队经过多年的努力,解决了仿生眼方面的很多问题。

比如这个抖动成像模糊的问题,让仿生眼在功能上前进了一大步。现在我们看到的是将仿生眼放在一个鞍马上,相当于人骑在马上,不管下面如何震动,仿生眼的成像依然是清晰稳定的。

还有双眼的协调运动问题。当人眼看向很相似的乒乓球时,人类可以很好的盯着一个乒乓球看,但仿生机器每个眼球都拥有独立的控制系统,如果不进行处理,右边眼球和左边眼球就可能看向两个不同的乒乓球。现在最新一代的可动仿生眼,当眼前的目标动起来的时候,它骨碌碌的大眼睛就会快速的转向目标物移动的方向。

想要机器人实现对空间整体而正确的判断,仿生眼如果只能做到二维的平面图像,机器人将无法判断自己在空间的具体位置,当遇到障碍物时可能也无法躲避。这时候就要做到更为精细的匹配。

稠密三维重建这是张晓林团队对这个问题提出的解决。

稠密是空间上所有的点都要对上,当空间上所有的点一一匹配,通过仿生眼,就能知道整个环境的深度。

深度图建立起来之后,辅以颜色和纹理的信息,就构成了整个空间的三维信息图,可以快速的检测出地平面和障碍物。这样大量的信息收集,应用到实际中,就不容易出现错误判断,对机器人的无人驾驶或者机器人的行走都增加了保障,它走了多少路,自己的位置在哪里,都能很清楚的知道。

仿生眼的一些功能应用在上海地铁上,把视觉上的障碍物检测装在地铁上。如果是无人驾驶的线路,就能利用这项功能在撞到障碍物之前报警,提高地铁行驶的安全性能。

利用仿生眼的原理,张晓林的团队还研制出世界上第一台3D摄影机。在通常的3D电影的拍摄中,要花费很长的时间调节两个相机的位置关系,会提高整个的拍摄成本。

在3D摄影机中,每一个相机下面都有三个以上的电机来控制它旋转,如果说产生偏差了,就能利用智能的控制系统,将偏差修正过来。

团队利用它一些京剧电影,真实的记录京剧老艺术家的风姿。告别了繁琐的人工调节,既提高了拍摄速度,又节省了人力。在轻松的遥控中,就能实现3D效果的拍摄。

科技的前进永无止境,仿生视觉虽然已突破了很多功能关卡,但依然在前行的路上。或许在不仅的未来,我们能看到它能实现从人工智能到自主智能,让机器拥有自主思考的能力。

或许有朝一日我们将迎来机器人的物种大爆炸,让我们拭目以待。

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();