■本报首席记者 顾学文
在刚刚闭幕的第三届世界互联网大会上,“大数据”再一次成为热词。
在大数据与人工智能掀起的智能革命中,人类社会将再次经历瞬息万变而又意义深刻的历史性变革。对此,我们该如何做好准备、迎接未来?
自然语言处理和搜索专家、畅销书作家吴军,在接受《解放周末》专访时说:“只要转变思维模式,我们就能、也才能‘看见’未来。”
过去三年,我们获得的数据量超
过了人类6000年历史的总和
解放周末:人类历史上的每一次技术革命都是围绕着一个核心技术展开的:第一次工业革命是蒸汽机,第二次工业革命是电,第三次信息革命是计算机和半导体芯片。
当下的智能革命被认为是围绕着大数据和人工智能展开的。因而,近些年来大数据之“热”也在情理之中。但是,当人人都在谈论大数据时,是否要先弄清楚,到底什么是大数据?
吴军:在很多人的印象中,数据就是数字,或者必须是由数字构成的。其实不然。互联网上的任何内容,文字、图片和视频,都是数据;医院里包括医学影像在内的所有档案也是数据;各种设计图纸,甚至是出土文物的尺寸、材料,也都是数据;我们的社会关系、我们每天的活动,都是数据。很多种数据,比如语音和文字,反而没有多少数字的内容。
解放周末:对人类而言,这些数据的意义何在?
吴军:数据最大的作用在于承载信息。但是,并非所有的数据都承载了有意义的信息,不仅如此,很多数据是人造物,可以被伪造,比如为了优化网页搜索排名而人为制造出来的虚假数据。
知识是人类进步的阶梯,我们用知识不断地改变我们的生活和周围的世界,而数据正是知识的基础。过滤没有意义的数据,删除伪造的数据,从数据中获取有用的信息,随后进行处理,人类就可以获得知识。
解放周末:计算机问世有70年历史了,这70年中,全球数据量按每年平均40%的速度增长,计算机的处理能力也在持续增长。但为什么数据只在今天引发智能革命?
吴军:简而言之,是因为以前的数据量不够,维度也不够,而现在我们能够采集、存储和处理大数据。
比如说,包括摄像头、可穿戴设备、GPS等传感器,收集着我们过去忽略的数据;而移动互联网使得数据传输变得十分便利。即便你睡着了,可穿戴设备仍在不断地传输数据,记录数据。存储的能力也大大提升了。而依照摩尔定律,计算机处理器的性能每18个月提高一倍。假如一台计算机18个月前一秒钟能算1亿次,今天能算2亿次,18个月后能算4亿次,再过18个月能算8亿次。
因此,过去三年,我们获得的数据量超过了人类6000年历史的总和。而且,预测一年半后,又将翻一番。这是一个非常快的速度。
光大没用,
大规模数据不等大数据
解放周末:当数据大到一定规模时,量变引起了质变?
吴军:原理是如此,但事情没这么简单。大规模数据还不等于大数据。2000年以后,数据量不仅剧增,而且开始相互关联,这才出现了“大数据”的概念。
大数据首先体量要大,这没有争议。但光是大还没用,比如一个人基因全图谱的数据,大则大矣,但没有太大的统计意义。大数据之所以有用,除体量大之外,还要具备多维度、完备性和及时性特征。
其中,多维度最重要。2013年9月,百度发布了一个很有意思的统计结果——《中国十大“吃货”省市排行榜》。百度没有做任何民意调查和各地饮食习惯的研究,它只是从“百度知道”的7700万条与吃相关的问题里挖掘出一些数据,但这些结论却可能比任何学术研究更能反映中国不同地区的饮食习惯。正是因为这些问题有着丰富的维度,只要人们愿意,就可以从这些数据中得到更多更有价值的统计结果。
解放周末:一提“大数据”,人们就会想到“人工智能”。这两者之间有何种关系?
吴军:在有大数据之前,计算机并不擅长解决那些需要人类智能解决的问题,但在今天,这些问题换个思路就可以解决了,其核心就是变智能问题为数据问题。
传统的人工智能方式是让计算机按照人的思路去做,但今天几乎所有的科学家都不再坚持“机器要像人一样思考才能获得智能”。比如“阿尔法狗”(AlphaGo),它不是靠逻辑推理获胜的,而是靠大数据和算法。在数据方面,谷歌使用了几十万盘围棋高手之间对弈的数据来训练它; 在算法方面,谷歌采用了上万台服务器来训练它下棋的模型,并且让不同版本的“阿尔法狗”相互对弈了上千万盘,可以说它几乎是算无遗策。
所以说,这是个智能的时代,而智能的基础是大数据,可谓“无数据、不智能”。
未来的城市,
更像一台超级电脑
解放周末:您在新书《智能时代:大数据与智能革命重新定义未来》中,描绘了人类从信息时代到智能时代的“关键一跃”。那么,“一跃”之后,我们面对的会是一个怎样的未来?
吴军:未来是一个很好的时代,也是一个很坏的时代。还是先讲讲好的吧。
比如交通。我们每个人的出行都是随机的,就跟布朗运动似的。未来城市是怎样的呢?你可以把整个城市想象成一台超级电脑,每一辆汽车是一个终端,可以从主机上获得一个优化的交通方案。在美国有人做过这样的试验,将原来70分钟的出行时间降到了20分钟。现在在北京,人们上下班平均要花两个半小时,如果能够按照这个比例节省,每天就有可能节省40分钟,社会效益非常可观。
再往后,马路上可能都是无人驾驶的电动汽车,连成一排往前开,像火车似的,不需要红绿灯。中间哪辆车要拐弯了,就从队伍里分出去。整个社会交通会变得更美好、更安全。
还可以用无人机来代替警察巡逻。这些无人机和今天的无人机不一样,它们很聪明,摄像头带有人工智能视觉识别软件,能够识别出潜在的犯罪嫌疑人。
解放周末:在智能时代,大数据对哪个行业影响最大?
吴军:大数据对商业的影响更为显而易见。我给你举个某服装奢侈品牌的例子。
奢侈品牌有个特点——决定销量的并非是价格,而是顾客群的喜爱。但此前,企业并不能很好地了解顾客喜好。进入大数据时代,问题有了解决方案——在商品标签里植入芯片,商品只要被拿进试衣间,芯片就能识别出来,并且记录顾客的试穿情况,同时推算出客户可能感兴趣的商品。这样,公司就能知道,一件衣服没有卖出去,到底是什么原因,就可以有针对性地改进产品,或者改变销售方式。
不仅如此,该品牌还改造了试衣间,试衣间里的智能屏幕会根据顾客的试穿效果,及时给出尺寸、颜色等方面的建议。因为充分利用了大数据,它的销售额从2001年的15亿美元增长到了2013年的40多亿美元,这个增速远高于服装业整体水平。
解放周末:大数据能否为制造业插上翅膀?
吴军:制造业的故事也有。
国内有家制造风力发电机的企业,全世界市场占有率排第二名,但企业就是不挣钱。企业负责人一心想怎么改进技术,但没什么效果。后来我问他,这些发电机卖到世界各地后情况怎样,谁在用,谁用得多,谁用得少,哪些配件、大概什么时候会坏、需要维修……他都回答不上来。产品一卖出去,他就不管了。
在我的建议下,他在发电机上安装了传感器,监控每部发电机叶片的老化程度。过了一段时间,他告诉我,他手里有了一张全世界风力发电的“地图”,他知道发电机卖到巴西后,根本转不了几下,而德国的风力强,风力发电机的覆盖率还不够。知道了这些,他就知道了怎么做市场。
又过了一段时间,他来告诉我,他改变了商业模式,不生产风力发电机了,现在产能过剩那么多,就让其他企业去生产,他只做服务,因为他掌握着相当大的数据,第一时间知道哪里的发电机需要更换叶片、需要维护保养。现在,这家企业的利润率非常高。
这就是用大数据的思维方式、用人工智能的思维方式考虑问题。很多时候我们总在抱怨制造业没有出路,其实,换个思路,就有出路。
连接比拥有重要,
合作比颠覆重要
解放周末:您刚才说到,这是个好的时代,也是个坏的时代。
吴军:是的。智能革命让一切更精细化和人性化,所有产业都将迎来挑战,包括农业、制造业、体育、医疗,还有传媒这个行业。
这是空前的挑战,因为它会造成非常多的社会问题——科技进步带来的未必全是生活水平的提高,也可能有很多困扰。比如,今天的我们生活在一个毫无隐私可言的社会里。我们自己就是隐私泄露者——你在手机里安装了那么多APP,参加了那么多优惠活动,都是在主动曝光自己。
雅虎曾被曝丢失5亿个账号。一般人可能会觉得,5亿个账号,哪那么容易从中找到我的信息?其实不然。处理这些账号的是机器,不是人工,找到你的账号、破解你的密码是很容易的。
解放周末:正因为此,智能时代渐行渐近,既让人兴奋,又让人担忧。人们担心自己的隐私泄露,担心工作会被机器所取代,人类甚至最终会被机器控制。那么,面对智能革命带来的挑战,我们该如何应对?
吴军:两次工业革命和信息革命都曾对当时的社会产生巨大的冲击,使得很多行业消失,但同时又催生出新的行业。不过,新的行业容不下那么多人,释放出来的劳动力需要寻找出路,这种影响花费了半个世纪、甚至更长的时间才消化掉。在这个漫长而痛苦的转型过程中,只有2%的少数人受益于新科技。
在机器抢掉人类饭碗的时代,如何做到不被抛弃?答案很简单——跟上智能革命的浪潮。98%的人,就是抱着旧思维不放、不愿接受新技术的人。比如,做秘书工作,可是不会用电脑,非要手写稿子,那你马上就会被淘汰。
解放周末:具体而言,如何改变思维模式?
吴军:比如,在“万众创新,大众创业”的“双创”热潮中,不可否认,不少创业是失败的。为什么?因为创业者总想着颠覆,而世界上的事大部分是合作,并不是颠覆。
从历史上看,任何一次技术革命的模式都是原有产业加上新技术,从而成为新产业。举个最简单的例子。第一次工业革命的时候,瓦特和博尔顿的朋友维奇伍德把蒸汽机用到了瓷器制造上,成为世界上第一个把蒸汽机应用到产业上的人。他做的还是瓷器,没有改做金属碗、金属盘,但是他改变了瓷器近千年供不应求的状态,维奇伍德因此而成为2%的新技术受益者。
就像阿里巴巴并不拥有实物商品一样,谷歌、脸书也并不拥有内容,但它们或者拥有人的连接,或者拥有内容的连接。连接是分享经济的本质。新时代我们要有分享的思维模式,而不是时刻想着颠覆。
解放周末:是否可以这样认为:中国拥有庞大的传统制造业,从这一角度而言,反而是一种优势?
吴军:是的。相比美国,中国最大的优势在产业上。在美国,已经没有了一大堆比较落后的“遗产式的产业”(Legacy Industries),而中国有。试想,每个产业如果加上智能技术实现了升级,就等于得到了一个新的产业。这是中国的机会。
总之,在未来的万物互联时代,或者说是智能时代,连接比拥有重要,合作、分享比颠覆重要。
挑重要的事情做,
而不是把所有事情凑合做完
解放周末:具体到个体的人,怎样才能成为这仅有的2%?
吴军:独立思考。这一点非常重要。很多人很容易接受结论,而不去关注结论产生的过程和方法,不去判断它是否正确、合理,是否符合常识。有人说自己太忙,没时间求证,在我看来,这是一种思想上的懒惰。别说没时间,我看很多人有大把刷微信的时间。
还有就是要简单化。永远要记得:两点之间,直线最短。任何复杂的金融产品都可能是骗局,因为它无法直截了当地告诉你它的赢利模式。
解放周末:除这两点之外,是否还应该多一些跨界思维?比如像您,当您写作《数学之美》《浪潮之巅》《硅谷之谜》的时候,您是科技专家。而当大家读到您的《文明之光》《大学之路》时,感受到的却是一位人文学者的思考。
吴军:和我在工作中接触到的一些国外专家比起来,我这点跨界不算什么。大家之所以会惊讶,只是因为我们太不“跨界”了。
这种不跨界从大学就开始了。一些同学接触了一段时间之后,发现自己并不喜欢这个专业,但制度不允许他转系,这往往导致他在大学四年里过着一种暮气沉沉的生活。
我一直呼吁,取消一进大学就分专业的做法,至少可以推迟一年;同时允许大家转系、换专业。当然,在环境没有改变之前,个人不应该放弃自我。机会总是会找到的,关键还是要有这种转换跑道的勇气——毕竟人生不是一锤子买卖。
解放周末:现代社会节奏日益加快,现代人压力日益增大。听说您是个做事情特别有效率的人,其中有何秘诀?
吴军:这是现代人遇到的一个普遍问题,唯一的解决方法就是挑重要的事情做,有些事情不做,而不是把所有事情凑合做完。在这方面,谷歌提倡的做事情的方法,或许能对大家有所启发。
谷歌把某一类人称为Pseudo Worker,直译就是“伪工作者”。这些人每天把自己搞得很忙,他们所做的可能也确实是公司的事,但这些工作对公司的发展不产生作用。比如某个互联网公司,不断地改版,其实这些修改既不增加新功能,也并没有让人觉得更好用。相反,他们很少开发出新产品,最终公司被并购了。
谷歌则相反,对员工的评价不在于他有多忙,写了多少代码,甚至不是完成了多少产品的改进,而在于产生了多大的效果。而伪工作者,即便装得再忙,最终也是被淘汰的。
解放周末:怎样才能防止员工成为伪工作者?
吴军:首先,管理者要让员工站在“做什么事能让公司获益最大”的立场上去工作。这样,他们才能在做不完的工作中,主动寻找那些对公司最有帮助的事情去做,而不是简单应付老板派下来的工作。而管理者本人,也存在着什么事情要做、什么事情可以不做的选择。很多我们看上去非做不可的事情,其实并没有那么重要。有些时候需要换一个角度来审视我们所做的事情,你就会发现,舍弃一些也未尝不可。
所以,每当你因总也干不完的工作而焦虑时,不妨试试先停下来,重新梳理一遍手边的工作:主动地站在对公司业务帮助最大的角度,站在提升自己能力的角度,先完成那些最重要的事情。
人物小传
吴军
曾设计了谷歌中、日、韩文搜索算法以及谷歌自然语言分析器,现为硅谷风险投资人。畅销书作家,著作《数学之美》获国家图书馆第八届文津图书奖、第五届中华优秀出版物奖,《文明之光》 被评为2014年“中国好书”。