人工智能(AI)来势汹汹,人类保卫战一触即发?

2017年,随着阿尔法狗接连战胜棋坛两大顶尖高手李世石和柯洁,AI这个词一夜之间变得家喻户晓。全球也兴起了一股AI创业投资的热潮。同时也产生了AI会夺走人类的工作这样的威胁论。仿佛一夜之间,所有人都开始谈论起AI,所有人都成了 AI专家。有人说,流行词的危害在于简化了人的思考。当AI成了一个流行词的时候,AI原来的意思却反而变得模糊。到底什么是AI?背后的技术又是什么?它是怎么发展到现在,又是怎么影响着我们的?到底AI会抢走我们的工作吗?今天就让我们来浅谈一下AI。当我们在说AI的时候,我们要知道我们到底在说什么。什么是AI

 到底什么是AI?如果搜索一下各位学术界大牛对于AI的定义就会发现,每个学者因为各自研究的领域不同,对于AI的定义也略有不同。当我们普通人说到AI的时候,恐怕大多数人对于AI的印象大概就是一个有着能和人类比肩智能的机器人形象吧。而在学术向商业化应用的方面,大多数情况下所说的AI则指的又是深度学习(Deep Learning)技术。不过不论是机器人还是深度学习技术,都还没有办法概括AI的全部。其中的原因让我们从AI的起源开始说起。

 图:日本总务省平成28年版情报通信白皮书:AI的定义

AI,是Artificial Intelligence的头文字缩写,中文翻译为人工智能。AI这个概念首次被提出来可以追溯到1956年。斯坦福大学的计算机科学家约翰・麦卡锡(John Mccarthy)在他自己提议发起的达特茅斯会议上,召集了志同道合的人共同讨论“人工智能”。这个概念也由他在那次会议上第一次被提出。这次会议持续了一个月。参加者基本上也都是后来业界的大牛。这场会议催生了后来人所共知的人工智能革命。而提出了人工智能概念的约翰・麦卡锡,也被后世称为AI之父。

按照约翰・麦卡锡的定义,他对AI作了如下的解释:

Artificial Intelligence is the science and engineering of making intelligent machines, especially intelligent computer programs.”

(直译:“AI是制造和产生具有智能的机器、特别是具有智能的计算机程序的科学和工程。”)

        图:约翰・麦卡锡:大家好,我是爸爸

    因此,可以说AI的目的就是为了赋予人工的系统(机器或者程序)人类的智能。不过对于如何实现这个目的,学术界有着不同的派别。最主流的分法可以按照“思考的智能还是行动的智能”,以及“类人的还是理性的”两个轴一共分成如图四个派别。其中这里的行动与其说是肢体的动作,更主要是指决策行动。

 图:Russell & Norvig:4 school of thoughts in AI

     不过不管实现的方式如何,基本上的AI大多都可以分为五个组成部分:学习、推理、问题解决、预测和语言。此外,按找阶段来分,AI又可以分成强人工智能和弱人工智能两种。强人工智能认为人类有可能制造出真正能推理和解决问题、且具有知觉的智能机器,这种推理和思考能力可以是像人的思维一样,也可以和人的思维完全不一样。弱人工智能则认为还无法制造出真正能推理和解决问题的智能机器,只不过通过某些机器学习、深度学习或者强化学习等技术手段,让机器看起来像是智能的一样。

图:人工智能的发展阶段

换句话说,只能实现上述AI五个组成部分中一个或者数个要素技术,比如图像识别、语音识别、情感识别、语音合成等,不管它们的精度如何,由于无法产生推理能力和自我意识,都只能算是弱人工智能。只有完全实现上述五个组成部分的技术,才能称为强人工智能。AI时代来临了吗

从上面的意义来讲,我们再来看一下人们普遍认知中AI——智能机器人就能明白,首先这种具备思考或者行动能力的机器人只是人工智能实现方法之一,根据具体需求的不同,AI可以表现为一个机器人的形式,也可以仅仅表现为一个处理某种问题的程序。再者,如果内部的程序本身无法使机器人作出和人类一样的行为或者与人类进行无阻碍地沟通的话,造出来的机器人最终的结果与其说是人工智能,更不如说仅仅是一个“人工智障”

人工智障的典型:软银的pepper

甚至可以说,实际上现在市面上推出来的机器人,大部分还处在“人工智障”的阶段。以软银的pepper这一类的对话机器人为例,由于现在技术的限制,大多数时候,对话机器人能做的还都停留于类似问答和简单的对话上面。这种技术的前提是需要事先预备大量的数据库或进行学习,或进行匹配。

一般来说机器人对话要实现对话功能,首先要通过语音识别的技术,把对方的问题转成文字,再根据关键字从Q&A数据库中匹配相应的答案,最后转化成语音进行答复。为了让对话更加逼真,一般这样的机器人会加装摄像头,通过人像识别技术找到说话者的方位,让机器人面向说话者进行对话。

然而这几个看似简单的步骤,每一步都有其技术难关……

首先语音识别的方面,如果在安静的环境中进行语音识别,现在的技术来说精度已经很高了,但如果要应用到日常生活中的话,如何识别和去除杂音则是一个很大的难题。此外,方言、口音的识别、少数民族语言的识别等应用范围不广、样本数据不多的部分也还需要提高。

其次答案的匹配方面,以现在的技术,如果数据库中不存在相近的答案,那么对话本身就无法成立,甚至出现提问和回答出现文不对题的情况。计算机的对话处理是根据一定的预设逻辑进行设计的,而人类对于同一个问题的表达方式却有无数种,甚至含有一定暧昧的部分。因此在答案匹配之前,如何正确判断说话者的目的本身也是一件很困难的事情。

最后在答案的选择方面,与人的对话实际上很难判断哪个是正确答案。根据每个人的性格、经历、知识水平、提问时所处的环境不同和心情,同一个问题就有N多种不同的答案,如何针对不同的人进行不同的回答,这还是一个等待攻关的难题。换句话说,现在系统能对应的对话范围还是针对某一特定领域、特定主题的对话,如果是完全的杂谈,还很难实现。

  接下来我们来看一下实现人工智能的各种要素的重要手段之一——深度学习(Deep Learning)技术。深度学习技术现在在研究界和商业化方面都颇受人们的关注。但之所以称它为实现人工智能的手段之一,是因为它并不能完全代表人工智能技术。

  作为实现人工智能的第一步,为了解决如何正确地识别、判断和分类数据这一问题,以统计学的理论为基础首先诞生了一门人工智能研究的分支:机器学习(Machine Learning)。机器学习简单地说就是“对能通过经验自动改进的计算机算法的研究”。其中包括了决策树、聚类、随机森林、线性回归、朴素贝叶斯支持向量机、相关向量机等经典模型,以及现在大热的以神经网络为基础的深度学习技术。

图:机器学习技术分类

  这一次人工智能浪潮,实际上是伴随着深度学习技术的发展而产生的。之所以深度学习技术会备受关注,主要是因为过去的模型需要人为设计特征量,这造成了AI学习效率和精度相对低下,而神经网络成功解决了这一问题。

   用图像识别来举例子,按照过去的模型,如果要识别一个物体是猫还是狗,需要先定义面部特征,然后让系统识别出在动物分类中哪些是重要特征。比如该动物是否有胡须、耳朵;如果有耳朵,那么耳朵是否是尖的。而这样的特征量过去的机器学习不得不人为设定。由于是人为设定,很难判断是否设定的有缺失,亦或是过多地设定了不需要的特征量。前者就会导致识别的准确度不高,后者则浪费了时间。

图:人工智能深度学习

而与之相反,深度学习会一次性完成这些任务,自动找到对分类任务重要的特征。深度学习的好处则是可以通过多层的神经网络,自动提取出特征量之后在每一层神经网络与教师数据作对比,根据对比结果自动调整误差、更新各个变量的权重,再进入下一层做对比、再调整,一直重复下来,最后给出来的结果的精度就比传统模型要高很多。

图:深度学习和神经网络

   正是基于这样的技术突破,才出现了现在这次AI商业化的浪潮。国内的领军企业,比如现在在语音识别方面我们所熟知的科大讯飞、在图像识别技术方面独领风骚的腾讯优图等等也都是得益于这项技术突破。

不过,就算是这样的深度学习,仍旧存在它的局限性……

  首先,深度学习需要大量的教师数据。比如图像识别,需要少则上千、多则上万的图片作为教师数据。越多的教师数据,识别准确度就越高。因此这样的数据储备,要么需要公司本身在这一领域有很长时间的积累,要么需要通过第三方购买。而现在的科技公司也正是看准了这一点,要么像BAT那样占据大量数据资源的同时,通过强大的资金实力并购或投资有相乘效应的领域;要么通过推动开源平台的建立,通过资源共享的方式相互补充。

  此外,还有一个问题,就是深度学习虽然特征量的抽取变得自动化了,但对于教师数据定义仍旧是人为的。这一点在物体识别方面还没有特别大的问题,但如果是情感识别、或者是更深层的好恶判定、价值观判断等带有主观色彩难以量化的课题上,现在的做法大多还是通过类似问卷调查的形式收集大量的数据来分析一定的倾向,所以在如何做到教师数据的客观和准确这一点上还有待提高。AI到底能做什么

可以说现在的AI技术还远远没有达到强人工智能的阶段,但就算是处于弱人工智能的AI技术,也已经给我们的生活带来了巨大的变化。

图:日本总务省平成28年版情报通信白皮书:AI技术的实用化

公共管理方面,比如阿里巴巴推出的城市大脑,在杭州市萧山区进行的实验,通过图像识别技术对行驶中的车辆进行识别,每15分钟根据道路上的摄像头调节交通信号灯,并自动运算繁忙路段的行使流量,疏导试验区交通,从而节省了每辆车在高架道路上行驶时间的10%

图:阿里巴巴城市大脑

公共安全方面,商汤科技的人像识别技术和北京、上海、深圳、四川、重庆等地先后落地应用,通过对公安刑侦机关数据库里的静态图像和监控资料进行对比,有效地缩小了犯罪分子目标范围。

医疗方面,腾讯公司的腾讯觅影运用图像处理技术通过对内窥镜、CT等医疗影像的分析和识别,现在可以辅助医生有效诊断的病种有食道癌、肺癌、糖尿病视网膜病变、乳腺癌、结直肠癌和宫颈癌六种,其他病种的识别也在紧锣密鼓地研发中。

翻译行业,科大讯飞在中英文翻译方面的正确率提高极为迅速。2014年以来,科大讯飞分别获得国际口语机器翻译评测大赛(IWSLT)第一名、NIST国际机器翻译评测大赛人工评价第一名的好成绩。而国外的谷歌翻译,更是凭借大量的用户数据的不断更新和学习,翻译的准确率也不断攀升。

电商行业,虽然淘宝的猜你喜欢现在被不少人吐槽,但由于有全国剁手党的购买数据作为教师数据,相信以后的推荐精度也有希望能够获得提高。

呼叫中心领域,以色列的语音情感识别企业Beyond Verbal和Nemesysco等公司通过提取声音的特征量,实现了实时探测消费者情感的技术,从而帮助用户公司提高了消费者满意度。

对话领域,对话机器人(Chatbot)也已经不是什么新鲜的话题了。通过对历史文本数据的学习,微软推出的微软小冰除了能和人进行对话以外,甚至还学会了写诗、出版了诗集。当然,对话机器人的出现对商家而言最大的利好大概还是解决与消费者沟通的时间,提高了业务效率。当然,对话机器人的出现对商家而言最大的利好大概还是节约了与消费者沟通的时间,提高了业务效率。

图:微软小冰诗集

此外,广告的定点投送、文章自动生成、物流的优化、甚至是自动驾驶等等,可以说最近十年间,AI从一个陌生的词汇到现在大家都开始谈论,甚至已经慢慢进入了我们的生活,开始取代我们部分的日常工作。AI会抢走我们的工作吗

最后,让我们回到本文一开始的问题,AI会抢走我们的工作吗?

要回答这个问题,我们要先理清AI和人类的区别在哪里。

从结论来说,由于AI是基于统计学模型,所有的分析和考量都是定量分析的结果,所以AI的目标永远都是识别和行动的优化,最终AI作出的选择永远是基于给予条件下的最优解。而人类虽然也会进行定量分析,但更多的时候是感情动物,所有的条件设定随着所处的环境不同而变化,相比追求最优解,更倾向于探寻在自己所处环境下最让自己感到舒适的解答。这种随意性里面充满了偏见、感情、过去的经验等主观性的东西。

图:人类和AI的区别

而人类的这种随意性和追求便利的特性,也许正好是我们最大的武器。AI为什么会发明出来?答案很简单,因为人类需要追求更舒适的生活,那么那些并不舒适的、甚至有些麻烦的事情,就需要创造出一些工具来帮我们完成。蒸汽机如此、电器如此、火车汽车飞机如此、AI也是如此。他们是一种工具,在某个环境下被创造出来满足人类的某些需求。也许在业务处理能力上AI会超越和取代人类的作用,但就跳跃式的创造这一点来说,不管AI怎么进化,都无法完全取代人类。

再者,如果从AI技术的本质来回答这个问题的话,答案是既会、又不会——过程中会,但结果又不会。

从本质来讲,AI技术革命和前几次的技术和工业革命并没有什么不一样,每次技术革命的产生都会淘汰一批旧的生产力,但与此对应的,这种技术革命所创造的工作机会却比其所淘汰的要多得多。

就好像汽车取代了马车,原来小作坊一两个人就可以制造一辆马车,虽然这样的小作坊倒闭了,但新的生产力创造的工作机会却养活了从原材料、零部件到组装厂整个产业链的工人。

AI,这个词看起来离我们很近却又似乎还有点远。到底AI的时代真正来了吗?大概就像电的产生一样,在电刚出现的时候人们都在谈论它,而真正当电线拉进千家万户变成像空气、像水一样的存在的时候,反而再也听不见它的名字。所以也许只有当我们不再提起AI的时候,才意味着AI的时代真的到来了吧。

致遠経営・商学大学院専攻塾

致远教育是一家致力于培养日本名校经营商学硕士,帮助留日学生完成学历升级的进学机构。以提供专业的升学指导服务为起点,延伸助推学生完成学历跃和职业生涯的升级。致遠教育 ∣聚焦经营商学

想要了解更多升学资讯,学校情报,考试信息

扫码添加微信,升学顾问老师为您专业解答

微博:致远经营

电话:090-9859-6100

邮箱:manager@farsighted-edu.com

地址:東京都新宿区大久保2-19-4  いせ市ビル5F

发表评论

电子邮件地址不会被公开。 必填项已用*标注