腾讯微信
腾讯微博
新浪微博
2017-06-09
看到人机大战中,柯洁被AlphaGo击败而落泪,感叹未来是属于AI的,你相信人类会被机器取代吗?在人工智能时代,哪些行业的从业人员,最先被机器抢走饭碗?人工智能的到来,是福还是祸?今日科技发展远比想象中快,要想跟紧潮流,人工智能是每个人的必修课。
在“慈善+”2017跨界公益论坛上,搜狗公司CEO王小川发表了题为《人工智能技术与应用思考》的演讲。他认为,慈善是在解决人与人之间、人与社会之间的冲突。人工智能的出现,更可能的是为人类提供帮助,通过技术帮人类解决基础问题,帮助传统产业升级,帮助人与机器更好地交互,从而产生更大的价值。人工智能可以超越人类本身的力量,极大地提升社会的效率,让社会更加和谐。为了更好地迎接人工智能时代的到来,互联网从业者应该充分了解人工智能到底是什么,并用人工智能技术去完善产品,造福更多人。
以下为王小川演讲实录
王小川:说到慈善,我想,慈善是在解决人和社会之间的冲突。社会这么大,里面有弱势群体,有企业家,有各种资源,怎么进行分配,能够使每个人都得到关怀?这种冲突,停留在人和人之间,未来已来,人工智能来了以后,引入更多的是冲突?还是帮助?人工智能到底是一种工具,能让我们的社会更加和睦,让我们的企业家也好,弱势群体也好,得到增强?还是会摧毁人类,将人类颠覆?其实在之前的一年,有很多朋友都在关心这样一个问题,甚至关乎伦理,那就是有了技术之后,也许少数人变得更加强大了,使得更多的人没有生存的能力,沦落为更加弱势的群体,或者是没有价值的群体,甚至引发更多伦理方面的问题。一辆无人驾驶的汽车,当它开动起来之后,更多的是在保护司机,还是在保护路人?有这种冲突的时候怎么解决?如果冲突不可避免,是保护车前的儿童,还是老人?这里面有很多我们要去思考的问题,不管是从伦理上、经济上,还是从技术上。
在这里我跟大家分享一些有关人工智能技术和应用的思考,更多的是希望大家对人工智能有真切的感觉,知道它跟我们的关系。这几天大家都在关心一场比赛,AlphaGo2.0来了,去年3月8号的第一场比赛,给我们带来了巨大的冲击,我们呼唤人工智能时代的到来,AlphaGo成为一项启蒙运动,让我们认可机器在某些领域里面比人做得更好。事实上在这个比赛之前,我跟一些医生聊,以后如果机器来了,机器能帮你诊断病人,或者能够去做手术,你怎么看?医生跟我讲,不可能,人的事情,机器做不了。但是比赛之后,我再跟他聊的时候,他们开始相信,未来机器在诊断或手术领域,有可能会超过人,这是一个巨大的变化。围棋比赛刚开始的时候,即便机器走出一些招数,聂卫平也好,其他的九段选手也好,都会说这个机器走了一步臭棋,认为机器是不懂围棋的。当比赛进行到后面几场,媒体报道发生了中盘逆转。前面都认为机器下得不好,可后来机器却赢了,怎么解释?我们必须要接受它,接受机器中盘逆转了,甚至后来他们对AlphaGo的称呼都改了,他们把AlphaGo叫“阿老师”,承认它是老师的角色。今天的围棋也是,如果有了AlphaGo,我们能让围棋走得更好,这会产生巨大的心理冲击。
去年第一场比赛结束之后,中国围棋队总教练俞斌在新浪做直播,离场的时候,新浪的编辑跟我说,他处于一种崩溃的状态,已经不知道怎么招呼出租车,不知道怎么上车了。今年第二场比赛的时候声音就已经一边倒了,大家认为人是一点儿取胜机会也没有了,事实也确实如此,前两场机器轻松战胜了柯洁,拿到了两分,这几天还在进行第三、第四场的比赛。
国富论的启示
回归我们的问题,人工智能到底带来了什么?咱们先不谈技术,而是谈基础认知,关于财富积累。亚当斯密在《国富论》开篇就提到,财富积累来自于社会分工和效率的提升。费孝通也提到,人口变多之后,才有机会带来更好的分工。互联网和人工智能时代有两个大的区别,互联网时代,按照我们现在的理解,上半场已经结束了,我甚至认为互联网时代已经结束,迎来人工智能时代。这两者有什么区别呢?在互联网时代里强调的词是连接,连接使得在一个村庄,一个城市,甚至一个地球里的人,都能更好地进行信息的沟通。我来讲一个《圣经》里的故事,人很高傲,他们同心协力想修筑通天塔。上帝觉得人类是在藐视他的权威,便使他们说不同语言,于是每个人之前无法沟通,因此修塔之事就此搁置。我拿这个寓言来讲互联网时代带来的意义,有了网络连接之后,伴随着信息的通畅,使得人跟人、人跟信息、人跟商品之间都建立了充分的连接,在此基础上,我们能够做到更好的社会分工,使得一万人、十万人,甚至十亿人各司其职,效率得到大幅度的提升,这是互联网在社会分工里带来效率提升的根源,从而创造社会财富。
右边我讲的地方画了一个人的学习曲线,人若想自己变得更有经验、分工变得更专业,是需要时间的,社会分工的意义使得一个人能专心去做一件事情,从而达到效率的提升。我们可以看到,但凡引入了深度学习这样的模式,在一些特定的领域里,机器的学习速度比人快得多。下面这条曲线是人的学习速度,上面的曲线,只要有数据,机器在一天、一周、一个月里面就能够到达特别高的效率,在这个工作方面取代人,在这个社会分工下创造更高的效率。
从互联网时代到人工智能时代,前者是通过连接促进社会分工,提升人的效率,而后者是在社会分工已经形成的情况下,让机器参与其中,从而提升整个专业性的效率,这是这个时代新的脉络。
人工智能的四个阶段
今天除了讲一下人工智能的含义外,我还要讲一下人工智能技术究竟发展到什么样的高度,我们能怎么用?从上世纪60年代到今天,我列出了人工智能的四个阶段。
第一步是60年代到80年代,在这个时代里面,我们已经畅想计算机带来人工智能。当时是怎么做的呢?其实机器本身的能力并不够,得靠我们的专家把自己的知识告诉计算机,写成一种规则,让计算机在规则里面做搜索工作,最后产生智能的结果。在我心中,最简单的智能机器是什么?大家都用过的一个东西,电饭锅,这是一种智能机器,因为研发人员能够告诉机器一个知识,每到103度就跳闸,否则饭就烧糊了。这是把人的知识教给了机器,机器去执行命令。或者是把医疗指南教给机器,让机器产生搜索能力,这是上世纪80年代之前的做法。很不幸,这种做法失败了,原因是人在总结知识,把知识教给计算机的过程当中,存在很多缺陷。因为人的知识并不一定足够多,而且很难表达给机器。所以80年代人工智能进入低迷期。80年代之后又有了一些新的做法,人们不告诉机器知识,而是告诉它特征,我们做汉字识别,语音识别,人脸识别的时候,试图靠人去发现这些图片、语音中间的部分规律,找到一些特征。做汉字识别的时候,告诉机器一共有多少笔划是一个特征,横和竖是一个特征,再告诉它,哪个汉字的图像对应这个文字。这时机器在人的指引下,能够应用学习方法去学习对一个特征到答案之间的匹配。这个过程中间又给人带来了希望,又经过一波的发展,使人工智能接近实用。但到2000年又失败了。怎么失败的呢?人在总结特征的时候,也会有困难。我们想识别一个人脸,王兵的人脸长什么样?脸瘦,很英俊,戴眼镜,鼻子高,就是他吗?人不是这样的,人是靠感觉的,这种感觉在特征的方式里是没法来表达的,用特征也很难描述对一张图像、一段语音、一个事物完整的表达,所以又失败了。
这种现状一直到2000年之后才发生改变。2006年有一篇论文,讲我们不要再尝试靠人去寻找事物之间的规律和特征,而是把原始的数据交给机器,让机器自己在里面发现特征,在里面做计算,付出的代价是一定得给机器更多的样本、更高的计算力。于是,从2000年开始产生爆发性的增长。我们发现机器比人在识别图像,识别语音领域更强大。包括像AlphaGo这样的机器,也是应用了这种方法,把围棋当成图像来进行识别。今天这个方法的成功,大大解放了专业技术人员。2000年之前,当我们要把知识教给机器,把特征教给机器的时候,要求我们的技术人员对于行业具备充分的了解,如果搞医疗的,就得对心脏病有认知,对图像有理解,所以对跨界的人才要求就非常高。但是到今天,只要给到数据,这种数据可能不是工程师生产的,他只要具备处理数据的能力,就能够把人工智能实现。所以我们常开玩笑,第一波被取代的人其实不是所谓的专业人士,而是有专业知识背景的工程师。
拿Google举例子,他们之前做翻译的时候,翻译工程师是要懂得语言学的,懂得怎么用统计方法处理语言。但当有了深度学习以后,就不需要这些工程师有语言背景了,只需要把英语、中文的语料库数据拿到,就可以对语言进行处理,反而使得技术人员的门槛大大降低。所以这个行业为什么有机会做成功呢?因为两个行业可以融合了,有传统领域经验和知识的行业,只要跟技术结合在一块儿,就能带来效率的提升。
第四个阶段,我们已经看到曙光,前面三个阶段还是要求人的知识,人的经验,或者是人构造的数据送给计算机去学习,AlphaGo在第一版本的时候用了三千万局的棋,而另一种方法是给机器定一个目标,告诉它要赢这盘棋,但不是用人的数据训练,而是两台机器之间互相比赛,一台机器输了,另一台机器赢了,就能训练赢的机器掌握更多训练的方法,以此做提升。
这场比赛之前我做了一个预言,可以完全不用人的数据训练,两个机器之间PK就能够训练出一个AlphaGo来。但很不幸的是,我的预言失败了,在这场比赛当中,虽然两个机器PK的权重已经大大提升了,但还是用了人的数据,今天的人工智能还不能脱离人,或者是历史的经验数据,依然靠数据驱动,没有完全达到让机器自由发挥的状态。比如说我们做医疗,就必须要求医生将历史数据带给机器,而不是机器自身产生真正的智能。
人工智能的三个产品类型
另外再看,人工智能的三种类型的产品,在传统的领域里面,我们说机器有感知智能、认知智能。我们分三个维度、分成不同的目标来看,人工智能能做什么?
第一件事情,做识别。语音识别、图像识别。比如说我们在安防、在大的征信体系里面识别人脸,已经到达很高的品质,或者是在语言的语音识别里面已经做得很好,这是机器能做的第一件事。
第二件事情,做决策。就像AlphaGo下棋一样,你给它一个初始条件,它会告诉你接下来应该怎么走;你给它一个人的背景,它会告诉你是否该给这个人放贷款;你给它股票的历史信息,它会告诉你该买该卖。
第三件事情,合成图像,合成语音。一幅画,机器能给画上色,能把黑白照片变成彩色照片。从这个维度来讲,但凡我们今天看到一篇论文,或者是一个行业突破,我们都可以分到这三类里面去,机器到底干的是识别的事情,决策的事情,还是生成的事情。
对于商业来说,最重要的事情是机器做决策,它们的效率比人更高,识别和生成更多带来的是人机互动,是改善人怎么去控制机器,以前是靠敲键盘的方式,靠鼠标的方式,以后可能会产生一个虚拟的形象,能用更自然的方法跟大家交流,这是机器如今能干的三件事情。
人工智能会取代哪些职业?
我们可以看到,有一些职业很容易被取代了,有些职业很难。从去年到今年,这个逻辑到现在没有变化,这两年人工智能虽然在算法上有很大提升,但并没有产生更大的突破。容易被取代的是工作环境封闭,目标清晰的工作,比如说某些医生的工作,如果他只是简单地看片子,告知病人患有什么疾病;或者是下棋,下棋的信息只来源于棋盘,不受棋盘之外任何信息的干扰;或者是审计报告工作;或者是开车,在封闭式道路里打方向盘……在这些领域里面,只要是封闭路径,需要做决策,机器就可以把人取代掉,或者是辅助人,人只做少量的决策,把更多的决策交给机器。剩下的工作难点是什么呢?是开放的。
我们知道,要写一篇好的文章,需要行万里路,读万卷书,在这种没有套路的环境里,我可以负责任地讲,以今天的机器人是做不到的。在绘画、创作这些领域里,机器做得好很多。前两天微软小冰写了一本书,根据图片写诗,还发了诗集,这是做创作,但是这种创作其实只是套路的结果,拿历史的数据和图像做训练,不能创造出在原有的数据规格之外的新诗。所以这种创作,只在几千个字里打转,写不出一本小说,或者产生新的故事。
传统产业的升级
有人讲AI在什么领域最好用?其实第一个是金融领域。以前有人问我AI能不能用来炒股票,未来有没有机会?我可以告诉大家,用AI炒股票这件事情,不是未来的事情,已经成为过去时。只是因为用AI炒股票这些人,闷声发大财,没有在媒体上宣扬过。但其实这个事情已经跑得相当成熟,特别是在短线、高频的交易里面。
另外,今天发展很好的是在金融领域里面,用AI做放贷,做贷款。以前人工贷款,可能贷一次款需要20万或者是更高的资金,人才产生效率,而且贷款对征信要求严格。今天在金融领域已经做了很多小额的放贷,一次放贷一两千块钱,机器在几秒钟之内就能作出决策。我上次在行业里面沟通,大家达成一个共识,经常举一个例子,如果你是用手机来申请贷款的,机器会根据你手机电量的情况选择是否贷款,如果发现你经常是手机没电的人,就会判断你还贷款的可能性偏低,因为你没有自我管理的能力。或者说,如果机器发现你的电话经常是呼出,没有呼入,那么你还贷款的可能性经过机器计算也是偏低的。
它可能用一千多维的数据做这样的识别,而不像原来只是靠人去调查“你有房吗,有车吗,有固定工作吗”,现在的灵活性高很多。而且机器做,也不追求完全的没有坏帐,比如说有5%的坏帐,对于机器来讲是好事情,因为它拿到了负面的样本。在做训练的时候,通过找到一些不还钱的人,机器才知道这群人有什么样的特征。在这种情况下,机器能自动发觉大量的特征,更好地做贷款。
另一个领域就是医疗,特别是图像,读片子领域,机器一定会取代人。实际机器在今天若干个特定领域里面已经做得很好,目前的难点是怎样让它进入医疗体系。医疗体系比较封闭,很排斥新技术的使用,我认为在未来两三年里,会有很大的突破。
再有就是教育行业,让机器因材施教来命题。对于学习成绩特别好的孩子,给予更复杂的题目,对于学习能力弱的给予简单的题目。
从人适应机器到自然交互
我们来说另外一件事情,人机交互。机器除了在大领域方面提升传统行业的效率之外,还有在交互领域的提升。以前在我们的世界里,人和机器接触时,是人去适应冷冰冰的机器。上世纪90年代,当时学电脑在中国非常风靡,催生了很多电脑学习班。在当时,学电脑就是学习打字,学习五笔输入法,不知道在座各位还有多少人会使用五笔,那是一个充分让人去适应机器的年代,人要记的东西很多。后来开始走向拼音,继而走向语音。键盘也一样,从鼠标到触屏。这里有一个简单的逻辑,人可以越来越懒,越来越自然,让机器去适应人。新的时代里面,机器跟人的交互界面会变成自然交互,人们用语言、手势、表情就能跟机器互动。我们可以想像,这个时代到来之后,人跟机器的边界又会被重新定义,这是人工智能在两大领域的使用,一个是改造传统行业的效率,一个是提升人机交互的界面。
Weakness带来的启示
即便面临很多瓶颈,我们还是经常讨论机器会不会最终把人灭掉。上次吴军讲到,我们在讨论机器是否能战胜人、取代人时,就像讨论火星上的房价是否过高一样,都是很遥远的事情。因为当今机器还有大量的弱点,去年AlphaGo在第四局输掉了,我称之为“美妙地输掉了一局”,如果机器五局全胜,人类会陷入一种恐慌。
当时Google的工程师检查程序,得出的结论是这个机器没有Bug,而是有Weakness,也就是说机器有弱点。但凡对机器进行数据训练,到一定阶段就可能会出错,这是深度学习之前不可避免的。今天的AlphaGo升级之后,虽然能力变强了,但是工程师依然无法保证它不会出错。
AlphaGo做得很成功,语音很成功,图像很成功,但是我们还是在一些领域做得不足,尤其是在自然语言的处理方面。搞计算机的都知道图灵测试,是指人和机器隔开的情况下进行测试,如果有超过30%的测试者不能确定对方是人还是机器,那么就认为这台机器具有了人类智能。可以讲,这个时代还没有到来,在可见的时间里面,还会不会到来?
去年,国内有一些研究所开始做一个命题,让机器参加高考,对于这件事情,我可以负责任地告诉大家,机器还没有达到这样的高度,在语言的理解,知识的理解里面,机器做得还不够好,无法通过图灵测试。
语音识别靠谱吗?
举一个简单的例子,如果我们一群人在一块儿聊天,发出不同的声音,你走进去,是能够在几秒钟之内跟踪住一个声音的,能够从多个声音里找到你想听的那个人的声音的。但迄今为止,机器还做不到,几个声音同时发声,机器是无法从中提取出一种声音的,为什么?因为这是它没见过的数据。机器在今天训练时走的套路,一定是拿一个人的声音进行训练,不管此人是男是女,分别训练没问题,但机器没有听过两种同时发出的声音,所以它做不到。甚至在汽车里面做语音识别,怎么才能做得好呢?车里有车窗的噪音,有风的噪音,有轮胎的噪音,我们需要拿着麦克风到车上把噪音取出来,跟原始语料做叠加,再教给机器学习。所以,在这个领域里面,机器离人还有很远的距离。
语言理解是人工智能的皇冠
另外,机器对于语言的理解能力更差。我在去年去了一个顶尖的剑桥实验室,他们做语言相关的对话系统,机器能帮你订餐,订酒店,做得非常惊艳。自然语言的处理和自然语言的理解是不一样的概念。左边的NLP是处理的意思;右边的NLU是理解的意思,这个时代还没有到来。跟大家举一个经典的例子,也是我的真实经历,当时机器帮我订好了餐厅,它问我“你需要停车位吗?”我回答“我没车”,于是机器就不懂了,它理解不了“我没车”是什么意思。我问你“你需不需要停车位”,你回答我“要”或者“不要”,这是该领域内的知识。在这个领域里面,目前的计算机还没有很好的模型,在通用领域里面去建立知识逻辑,这是目前很大的缺陷。
我最后再补充一点,我们在很努力地做语言方面的业务,给大家秀一个图。这是今年的一档电视节目,我们造了一台机器放在这里面。今天的人机对话带给大家一个概念,能够提供回答的机器已经代表先进的水准。大家知道IBM Watson在2011年做了一台机器来回答问题,但那时的技术离今天还有距离。
今天的机器可以不再使用文字输入,而是像汪仔一样是靠语音和图像获得题目信息,跟主持人通过多媒体互动,而且没有自己的独立数据库,是把互联网作为它的知识储备。如今的机器还能做抢答等等,这已经代表了问答领域最高的水准。
机器翻译的突破
我们再提一个环节,那就是技术除了在金融领域的应用,在人机交互领域还有一个大的机会,机器翻译。深度学习在这个领域里已经取得了一些突破性的发展,尤其是Google代表了这个领域里最高的高度,从70年代基于规则的机器翻译,到2016年NMT神经网络机器翻译,实现了质的突破。如果以前大家用过一些翻译系统,请问大家使用感受怎么样?翻译的语言读起来特别不流畅。而今天的翻译在深度学习下已经能够做到语言非常流畅,你看不出是人翻译的,还是机器翻译的。唯一的缺点,偶尔会翻译错误,跟AlphaGo下棋一样,这是现在技术还没有能力去突破的。
在日常沟通领域里,比如说商务和旅游领域,机器翻译都没有问题,但在法律等领域目前还做不到。预见未来两三年里面,大家手持翻译机,就可以进行跨语言交流。这个时代的到来是非常激动人心的,对中国是非常有意义的。因为中国的人口在全世界是最多的,但是我们的母语中文不是世界语言,现在我们要跟全世界进行交流,需要拥有翻译的能力。
我们在这方面做了很多的工作,搜狗的搜索可以去搜索全世界的信息,因为它可以将你输入的中文翻成英文去搜索,再翻译成中文来呈现。 这就是我今天想要分享的内容,一方面AI能够带来效率巨大的提升,另外一方面,通过人工智能让大家表达和获取信息更加简单,从而跟机器产生新的互动。在我内心当中,是把机器当成一种新的生命来看待的,它跟我们的关系就像朋友一样。它在成长,我们需要尊重它,善用它,它能帮助我们做好事,能成为社会当中的一部分。一旦我们学会怎么跟机器相处,就能更好地学会怎么跟人去相处,谢谢!