他曾令天河一号登上全球超算五百强榜首,今又论起AI和因果

“大数据时代最大的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。”维克托·迈尔·舍恩伯格曾在《大数据时代》一书中明确写道。

但“因果关系”真的应该被放弃吗?

一个不得不面对的事实是,当前大数据的处理面临着储存容量不够用、数据采集传输存储处理不及时、数据格式难统一、数据价值难体现等挑战。这些问题不解决,数据越多,越容易陷入“数据沼泽”。此时,厘清因果关系,反而成了认清数据本质,进行数据治理的关键。

6月26日,第二十四届中国科协年会开幕。主旨报告环节,中国科学院院士杨军直接表示:“因果关系打开了一扇通往强人工智能的‘科学之门’。”

杨学军院士在中国科协年会上作报告

谈一谈“因果”

“相关”和“因果”怎么理解?

一个简单的例子,公鸡打鸣和太阳升起有相关关系,但我们没办法去说,太阳升起是公鸡打鸣造成的结果。

而在人工智能领域,它在机器学习的过程中,往往被“投喂”的就是相关性的数据,这常常使AI在真实条件下出现各种问题。比如说,扫地机器人学会了扫地,但它可能不知道为什么要这么做。不然就不会出现#狗在家拉屎被扫地机器人涂满全家#这样的新闻了。

微博截图

图灵奖获得者朱迪亚·珀尔曾引发人工智能的因果革命热潮,他就直截了当地说过“数据是非常愚蠢的”,“现代的计算机跟我们的大脑完全不一样”。

在珀尔看来,人工智能必须要懂得因果关系,才能进化为“强AI”。杨学军院士显然也极为认可这种说法。他认为,目前的人工智能本质上基于大数据,而“数据沼泽”问题成了人工智能由弱变强路上的绊脚石。因此,他提出要发展因果关系数据湖技术。

这是一个智能数据管理系统。用户无需对数据进行结构化处理,即可按原样组织存储大容量、高维度、众源头、多格式的数据,具有按因果关系之梯对数据进行智能处理的特性。

杨学军院士所说的“三个阶梯”分别是:

关联推理,“我看到了什么”;干预推理,“如果我行动了会怎样”;反事实推理,“当时我做了会如何,没做会如何”。

“我把这三个阶梯称之为‘眼腿脑’定律——不仅要读万卷书,还得行万里路,想万种事。”杨学军说。

近年来,他和团队按照核心概念开发、架构设计创新、关键技术突破、典型应用验证的步骤迭代推进,已经进行了相关应用。比如利用因果关系数据湖系统深度阐述新冠疫苗在人体内的免疫效应和规律。

“可以是以云服务的形式部署的数据中心,也可以用软件的形式部署在边端平台。”他补充道。

杨学军院士在2020世界计算机大会上发言

“要自主地做好”

“此人要想办法留下来。”这是“银河-I”总设计师慈云桂在杨学军的博士论文上留的批注。3年后,我国决定立项上马“银河—Ⅲ”时,31岁的杨学军成为总设计师,成就了一段师生佳话。

“银河”系列的运算速度一路飙升——I时代的目标还是每秒钟亿次,Ⅱ时代就到了十亿次,到了“银河—Ⅲ”已经在向百亿次冲刺了。这基本符合超级计算机研制以10倍速度递增的规律。

但到了“天河一号”时,杨学军却不想按部就班地走了。以他为总设计师的总师组决定,从每秒十万亿次直接冲刺千万亿次。

“天河一号”千万亿次超级计算机系统。 新华社发(何书远 摄)

他们的底气,就是由杨学军首创的CPU+GPU异构协同计算技术。但2009年第一次尝试时,杨学军团队不仅没能实现1+1>2的结果,还遗憾地发现计算效能只有20%左右。为了解决这一问题,他们进行了大半年的封闭式攻关,终于见了成效。

2009年 11月,“天河一号”在世界超级计算机500强排行榜上夺得世界第五、亚洲第一的好成绩。前10名中,除了“天河一号”,其余9台计算机都是美国研制。

一年后,“天河一号”二期系统在全球超算500强榜首,第一次留了中国超算的名字,使中国成为世界上第二个摘得这一桂冠的国家。中国在国际超级计算领域开始有了话语权。

“高性能计算机是国家的基础设施,像高速公路对国民经济的作用一样。”杨学军强调道:超级计算必须要做好,而且要自主地做好!

48岁,当选中国科学院院士;56岁,被授予上将军衔,成为当时现役中的最年轻上将;58岁,编号330640的小行星命为“杨学军星”——不论何时,对“自主”的追求都牢牢地刻在他的足迹中。

即便是如今,他在谈到“机器人革命”时,也认为器人操作系统将成为机器人实现自主行为、群体协同和人机共融的“新脑”。而“我国需要一个真正属于自己的操作系统”,不然“谈自主可控都会感觉到没有基础、没有底气”。


发表评论
留言与评论(共有 0 条评论) “”
   
验证码:

相关文章

推荐文章