2017年11月24日中国科学技术大学信息学院执行院长吴枫受邀出席第四届中国(合肥)互联网大会,并发表以《大数据智能》为题的主题演讲,以下为演讲和PPT实录。
吴枫,中国科学技术大学信息科学与技术学院教授,中组部千人计划引进人才,国家基金委杰出青年项目获得者,类脑智能技术及应用国家工程实验室主任,IEEE Fellow。
吴枫:今天非常高兴有这个机会给大家做一个交流,我今天的主题演讲是大数据智能。在过去一二十年经历了很多,有一个感觉,在信息领域,这个概念变得特别快,一会物联网、一会云计算,一会大数据,现在又是人工智能,现在大家也不知道这里面的关系是什么,我今天就想说这些。
这是一张人类的发展图表,横轴是人类发展一万年的历史,纵轴是一个发展的指标,大家可以看一下人类社会发展有一万年,但是发展的数字很平凡,只有在最近六七十年里发展数字增长很快,所以我们可以看一看,在过去的几十年里究竟发生了什么。
首先我想说技术,任何一个技术发展实际上都是有有一门技术,我们这一波信息的革命,它的理论技术有两个,第一个是香农信息论,实际上检验了我们对数据信息的两个问题,另外一个就是解决了通信和网络的问题,这对我们当今的发展是起着重要的作用。另外一个就是冯诺依曼的体系架构。我们说ICT,就是信息领域,实际上ICT信息,我们刚才说的信息论,他俩是有一个基础,这也是一个信息能够支撑的。另外还有一个就是计算机,这三者的ICT支撑了我们所说的互联网的发展。
互联网实际上最早的一个网络是1969年出来的,我们今天的互联网最初实际上就是四个结点一个网络,后面进一步发展,设备能够连接起来。中国的话,实际上到1987年才有数据,再后面的话,我们现在的互联网真正产生了雏形,再看后面有很多的伟大的东西出现了,实际上这里面,大家可以看一看,我们在互联网的云数字上可以看出,到1995年的时候,全球只有很少的在使用互联网,中国只有一万,到现在全球互联网用户是30多亿,我国是7.5亿,所以这个指数是一个快速的增长。我个人来说,正是互联网的发展才产生了大数据,因为只有互联网才能让我们做每一件事通过网络留下数据。
下面讲一下移动终端,现在是移动互联网时代,手机的流量超过了互联网的流量,手机的终端超过了终端服务器等等,但是实际上手机只是大数据的其中之一,它是更方便去产生使用互联网,或者到各个公司获得更多用户的操作。刚才讲了十几上互联网的发展到现在,基本上是稳定了,因为用户的增加是很难无止境的增加,但这并不意味着后面的大数据发展会停住,大家可能没意识到下一步互联网大数据的发展不仅是人为主,我们现在大数据跟人是有关的,你上网买东西、打车,都是在为此做贡献。但是物联网可能在明年或者后年还有爆发式的发展,因为互联网的数据的基础,包括我们对物联网各方面的支持,所以后面工作的数据是从各个方面来的。
有了互联网,有了手机,将来还有物联网,我们经过了一个大数据的时代。我这里有几个例子,大数据实际上目前来说,互联网的大用户基本上有很多大的数据,在谷歌搜索中,每一次搜索都给它的大数据贡献了一条记录,你用谷歌地图导航,实际上你看一个视频,实际上都在为互联网大数据做贡献,特别是手机做出了贡献更多,获取数据的方面更广,获取非常大的数据。这种大数据实际上我们都有,以前我们很难想象得到,这是很经典的故事,就是说通过大量的搜索可以预测流行的趋势和系列的监测。另外就是购物式的,我们刚刚经过2017光棍节,2016年的光棍节的数据和美国黑色星期五的数据,销售量不到阿里的1/4,所以有销售数据,你在销售产品的时候就有很大的优势,你可以把用户想要的这些信息推送给他,你可以把他需要的东西摆在显眼的地方。
另外还有一个是社交网络数据,我相信我们在座的每个都有微信,无论是你在生活中,你的朋友、你的家人,还是你的工作中的同事,你都会有微信联系,所以微信真的是改变了人的通讯的方式,改变了人的社交方式,它的那种大数据的力量也是非常大的,大家也都听说过中国的革命,实际上是和脸谱网有很大的关系,实际上起因是很小的事,使得它演变成了非常大的事,所以社交网络产生的数据对社会有很大的影响。大家也知道现在在合肥可能还好,你在路上招个手可以打到车,但在北京基本上不用叫车软件就打不到车,很多出租车都不停,因为他已经接单了,所以像滴滴这样的数据平台已经掌握了大量的数据,这实际上对我们将来城市的管理等方面有非常大的作用,互联网一出来,下一步更多的会带来共享经济,滴滴打车可以用私车做公共的服务。所以整个互联网通过大数据也在不断的创造新的经济,改造旧的经济。
大家可以看出,正是因为现在大数据的发展,在一些大的公司拥有大量的数据。但是大家也知道这种数据现在也是比较敏感,各个公司都把自己的数据作为公司的核心资产,然后整个数据形成一个一个数据核心,所以像合肥市成立大数据资源局,我觉得这是一个很好的途径,通过政府的管理,希望能够打通大数据的壁垒,使得大数据真正为经济和产业服务。
智能时代,大家都在说大数据、人工智能,我们科大目前来说也在计划成立人工智能与大数据学科,实际上是两个面,因为数据大,它的数据实际上人已经看不过来了,那么多数据必须要由机械来看,机械也看不出来啥,必须要有智能才能把数据串联,结点一定要去看。这是就是大数据需要人工智能,另一方面大数据也需要不断的学习来提高能力。当然这里面人工智能刚才说我是负责类脑,实际上大家都知道现代人工智能是进入生物学一起研究的,但是也有很多问题。所以类脑智能实际上都是人工智能,只是人工智能发展的两个不同的阶段而已,类脑智能是深的下一个技术阶段,也许这个阶段不是那么明显,它是一个相互融合的过程。
人工智能主要是深度学习和大数据结合,然后实际上主要是两个方面,一个是计算单元,一个是多层次结构上。然后大家可以看一下从这个结果来看,深层的网络化实际上对人工智能有非常大的提高,早期的浅层的识别率只有75%,到后面回达到96%,所以大家可以看出这样一个大的网络,没有大的数据、没有大的计算量是没办法进行学习的,包括大家对语音语言的都比较了解,所以语音识别等等也都是用深度学习的方法。包括自然语言的发展,包括我们的刚才的开场白,很多的机器对话也都是深度学习为基础的。
另外一个就是围棋,围棋这一块实际上阿尔法GO给大家带来了非常大的震撼,最近他已经不用学习人的棋谱了,就是两台机器自己不断的下棋,然后从自己失败的教训里面和自己赢的棋里去学习,当两个机器下几百万棋的时候他的学习已经超过了前一个阿尔法GO,所以大家可以看出,实际上机器人也可以通过自己产生的大数据,然后来进行学习,实际上有人想说阿尔法GO不需要数据,我个人觉得它只不过是维系它的判断,所以可以通过简单的判断,机器就能知道我这个棋该怎么下,通过这个来进行决定,只是有一个简单的判断的准则。
下面说一下对合肥的发展建议,大家知道任正非在科技大会上的发言,说未来的二、三十年人类社会将演变成为一个智能社会,其深度和广度我们都还想象不到,大家可能认为人工智能可能马上就要到来了,其实不是这样的,它也是需要很多年的发展,还需要大量的技术和数据,在各个方面都要继续发展,跟传统的行业技术结合,现在只是刚刚开始。
然后下面讲一下,实际上合肥跟北京、上海比有优势,实际上大家可能没有注意到,合肥发展非常有优势,这里我划了三个区域,一个区域就是高新区,有很多学院,然后是人工智能与大数据学科,这就相当于我们在这样一个产业区会为人工智能和大数据提供源源不断的人才。另外讯飞、商汤、科大智能等人工智能领跑企业,另外在科技部刚刚拿到了人工智能的创新平台。另外我们也还有各种各样的平台,包括类脑国家工程实验室,语音语言国家工程实验室,这都是和人工智能相关的,所以合肥市已经形成了人工智能的发展平台,这是产学研能够深度融合的产业代的高度,有可能跟产业带不同,他是一个产学研深度融合的。谢谢大家。
[file]
(附:本文根据现场速记整理,可能会有疏漏错误,请见谅。未经允许,请勿转载!请关注“i创会”公众号,联系小编微信:damo1000)