2014年6月7日,在英国雷丁大学组织的“图灵测试2014”活动中,俄罗斯人Vladimir Veselov开发的人工智能软件——Eugene,通过了原版图灵测试。该软件是5个参赛电脑程序之一,它模仿一个13岁的小男孩回答了测试者输入的所有问题,其中33%的回答让测试者认为:与他们对话的是人,而非机器!
图灵测试是英国“人工智能之父”阿兰·图灵(Alan Turing)1950年设计的,目的是在测试者在与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问,问过一些问题后,如果被测试者(机器)超过30%的答复不能使测试者(人)确认出对方是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能。换言之,在阿兰·图灵提出图灵测试64年之后,第一次有软件通过此测试。
尽管对这一事件有一些争议,但毫无疑问,它是人工智能乃至于计算机史上的里程碑事件。从某种意义上说,它喻示着人工智能时代即将来临。
没错!一个新时代就要开始了。它是近几十年来人工智能不断发展,即将从量变到质变的结果。此前,还有两个标志性的事件值得回顾:
一是深蓝计算机与卡斯帕罗夫的比赛。1997年5月11日,IBM公司的深蓝计算机在一场国际象棋比赛中与俄罗斯棋王、国际象棋世界冠军卡斯帕罗夫进行第6次交手。此前,双方已苦斗5局,打成2.5∶2.5平手。在第6局决胜局,誓要捍卫人类尊严的卡斯帕罗夫在仅走了19步的情况下就眉头紧锁,向深蓝“拱手”称臣。整个世界为之一振。这是在智力较量中机器第一次打败了人类专家,它意味着智能机器具有了高超的推理能力。
二是“Google Brain”项目中的识猫成果。2011年,当时供职于谷歌的人工智能专家吴恩达(Andrew Ng,1976年出生,华裔美国人,斯坦福大学计算机科学系和电子工程系副教授、人工智能实验室主任,是全球人工智能和机器学习领域国际上最权威的学者之一)启动了“Google Brain”项目。这个项目利用谷歌的分布式计算框架和大规模人工神经网络,能够在没有任何先验知识的情况下,仅仅通过观看无标注的YouTube视频,学习如何识别高级别的概念,如具体的动物——猫。这就是著名的“Google Cat”,它的面世意味着机器具备了像人类一样的感知能力。目前,这个项目的技术已经被应用到了安卓操作系统的语音识别系统上。
当人工智能具备了推理能力和感知能力,机器取代人类的一天还有多远?对此,不同的专家有不同的时间表,前百度研究院常务副院长余凯博士的时间表如下:
第一阶段(2000~2009):润物细无声
AI(人工智能)大规模应用应该是从2000年开始的,因为PC互联网产生大量的数据,推动了人工智能的发展。这里面包含三大应用——搜索、推荐、广告。但这个时期人工智能的应用是“润物细无声”的,为什么这么说呢?因为它是一些偏后台的技术,用户不是那么容易可感知的,尽管它实际上能产生巨大的产业价值。
第二阶段(2010~2019):于无声处听惊雷
2010~2019年的第二阶段就是今天我们所处的这个时代,我们将它形容为“于无声处听惊雷”。从PC互联网到移动互联网,更多的数据,更强大的计算能力和网络带宽,还有更强大的模型,比如说深度学习,又比如说让语音识别从过去完全不可用到现在的可以预期。
百度第一个语言识别的系统,最初在安静条件下,其准确率可达80%多,而如今能达到95%,这仅花了两年时间。技术的发展在非常快速地进行着。
大数据和深度学习让AI从后台走向前台,从不可感知变成可感知。它催生的产业规模也很大。为什么呢?因为前面讲的搜索、推荐、广告,这三个业务还在持续地发展,并不断地产生更大的价值。但同时,这些技术也向传统产业延伸,比如说物联网,又比如说自然语言理解和机器人的一些技术。特别值得一提的是,机器人技术里面有一个重要的技术,即自动驾驶技术,在2015~2020年会快速发展。技术层面的问题基本会在几年内被解决,剩下的主要是法律法规、道德伦理这些问题。
第三阶段(2020~2029):江山如此多娇
2020~2029年的第三个阶段,完全是一个预测,我们将之形容为“江山如此多娇”。因为在这个时期,我们将会看到大规模的人工智能应用。主要有三个趋势在推动其发展:第一个是社会需求,第二个是产业趋势,第三个是技术趋势。
智能化的浪潮又将卷携着我们去向何处?答案是“万物智能”:社会的趋势,必将从万物互联走向万物智能。也就是说,以后的一切设备都将是一个人工智能系统,都会变成机器人!具体而言,即以后可能我们身上的每粒纽扣、每只鞋子都是智能设备,都可以互相连接并接入云端。
所以,那个时代可以称为“智能一切的时代”。“智能一切”这个概念出自乐搏资本创始合伙人杨宁。在他看来,手机这个设备在5年内就将消失,会被穿戴设备、植入设备等智能硬件所取代。“你的手表、你的项链、你的戒指、你的眼镜、你的汽车、你的桌子、你的房子……你的所有终端设备都是智能化的。当通信、收发信息、各类应用和功能成为所有智能装备的标配,请问,你为什么还需要一个装在裤兜里的手机?”
换言之,当智能一切的时代来临,我们将被各种智能设备和智能机器人所包围,且数量多得惊人。日本著名互联网投资人孙正义预言,2020年我们每个人都会平均连接1000个设备。进而言之,未来如果没有智能机器人,你将难以适应,就像现在如果没有互联网、没有手机,你将无法生活一样。
让我们想象一下未来的生活:你睡醒睁开眼睛的那一刻,就已经生活在一个智能机器人充斥的环境中——你的家本身就是一个综合型智能超级机器人,智能卫浴会为你自动调节洗浴水温,智能厨房会为你自动烹饪早餐;出门上班时,交通工具会是一辆无人驾驶的机器人汽车;走进办公室,你的智能桌子会立刻感应到,为你打开邮箱和一天的工作日程表……
作为开启一切智能的端口,你将根本不再需要一部笨重的手机,只需要一枚带感应和身份认证功能的戒指:如果你想打电话,只需走到桌子旁边,用戒指触碰下桌子,桌子就会自动调取你的个人通讯录,你想呼叫谁,桌子就可以直接打电话;你走到冰箱前触碰下冰箱,冰箱就会自动告诉你哪些水果没有了,你可以在冰箱上直接下单购买;你走到衣橱前触碰下衣橱,衣橱就会自动告诉你哪几款衣服适合搭配,你甚至可以通过衣橱直接进入淘宝页面选购新款衬衣……
人工智能设备就像“魔戒”一样开启并连接一切。
智能化技术将改造我们生活的方方面面,它让交通变成了“智能交通”,让医疗变成了“智能医疗”,它也推动了智能农业、智能城市等的发展……
法国历史学家雷蒙·阿隆在叙述当今机器人时代时说:“这些人工智能的建构,把之前存储在人脑中的智能嵌入机器中,这在人类史上是重要的时刻。”
演化经济学(也可译为进化经济学)的代表人物之一卡萝塔·佩蕾丝(Carlota Perez),在1983年发表的一篇具有里程碑意义的论文《结构性变迁与新技术在经济和社会体系中的吸收》中表达了一个观点:重大的技术变迁不仅意味着一批新产业非同寻常地迅速成长,还意味着在长期内许多“旧”产业的新生。这些旧产业在新产业的影响下,找到了利用新技术并在组织和管理上进行变革的方法。佩蕾丝将关于生产体系(包括其组织、技术及其相互依赖性)的各种新的思维方式的结合称为“技术-经济范式”(techno-economic paradigm)的变迁。如今伴随着IT技术的发展及以其为基础的一些新产业的成长和被其“变革”的一些旧产业的脱胎,这一概念已广为大家所接受。
半个多世纪以来,传统IT技术、互联网技术、移动互联网技术分别催生了一些新产业,变革了一些旧产业。目前移动互联网技术仍处于风口浪尖,不过,如许多人的预期,它们很快就会被智能技术所“加持”,因为智能技术正在快速走向成熟。由于其将比以往任何技术革命都要更普适地、更具象地改变人类的自我意识和人物关系,所以它将比传统IT技术、互联网技术、移动互联网技术更深入而广泛地影响我们的社会形态、经济结构、文化生活,其中最明显的,就是为我们带来一些新的产业并让一些旧产业获得新生,从而形成新的“技术-经济范式”。
人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门综合性学科,涉及计算机、控制论、信息论、神经生理学、心理学、语言学等众多领域,核心是认知科学与技术。而就目前来看,认知科学最重要的5个分支是计算机视觉、机器学习、自然语言处理、机器人和语音识别,因为在这5个分支中取得的成果,或者说掌握了这5个分支的技术,将大大有助于我们了解智能的实质,并生产出一种新的、能以与人类智能相似的方式做出反应的智能机器。
换言之,计算机视觉、机器学习、自然语言处理、机器人和语音识别是人工智能的五大核心技术,它们均会成为独立的子产业。
计算机视觉是指计算机从图像中识别出物体、场景和活动的能力。计算机视觉技术运用由图像处理操作及其他技术所组成的序列,来将图像分析任务分解为便于管理的小块任务。比如,一些技术能够从图像中检测到物体的边缘及纹理,分类技术可被用作确定识别到的特征是否能够代表系统已知的一类物体。
计算机视觉有着广泛的应用,其中包括:医疗成像分析被用来提高疾病预测、诊断和治疗;人脸识别被Facebook用来自动识别照片里的人物;在安防及监控领域被用来指认嫌疑人;在购物方面,消费者现在可以用智能手机拍摄下产品以获得更多购买选择。
机器视觉作为相关学科,泛指在工业自动化领域的视觉应用。在这些应用里,计算机在高度受限的工厂环境里识别诸如生产零件一类的物体,因此相对于寻求在非受限环境里操作的计算机视觉来说目标更为简单。计算机视觉是一个正在进行中的研究,而机器视觉则是“已经解决的问题”,是系统工程方面的课题而非研究层面的课题。因为应用范围的持续扩大,某些计算机视觉领域的初创公司自2011年起已经吸引了数亿美元的风投资本。
机器学习指的是计算机系统无须遵照显式的程序指令,而只依靠数据来提升自身性能的能力。其核心在于,机器学习是从数据中自动发现模式,模式一旦被发现便可用于预测。比如,给予机器学习系统一个关于交易时间、商家、地点、价格及交易是否正当等信用卡交易信息的数据库,系统就会学习到可用来预测信用卡欺诈的模式。处理的交易数据越多,预测就会越准确。
机器学习的应用范围非常广泛,针对那些产生庞大数据的活动,它几乎拥有改进一切性能的潜力。除了欺诈甄别之外,这些活动还包括销售预测、库存管理、石油和天然气勘探,以及公共卫生等。机器学习技术在其他的认知技术领域也扮演着重要角色,比如计算机视觉,它能在海量图像中通过不断训练和改进视觉模型来提高其识别对象的能力。
现如今,机器学习已经成为认知技术中最炙手可热的研究领域之一,在2011~2014年这段时间内就已吸引了近10亿美元的风险投资。谷歌也在2014年斥资4亿美元收购Deepmind这家研究机器学习技术的公司。
自然语言处理是指计算机拥有的人类般的文本处理的能力。比如,从文本中提取意义,甚至从那些可读的、风格自然、语法正确的文本中自主解读出含义。一个自然语言处理系统并不了解人类处理文本的方式,但是它却可以用非常复杂与成熟的手段巧妙处理文本。例如,自动识别一份文档中所有被提及的人与地点;识别文档的核心议题;在一堆仅人类可读的合同中,将各种条款与条件提取出来并制作成表。以上这些任务通过传统的文本处理软件根本不可能完成,后者仅针对简单的文本匹配与模式就能进行操作。
自然语言处理像计算机视觉技术一样,将各种有助于实现目标的多种技术进行了融合。建立语言模型来预测语言表达的概率分布,举例来说,就是某一串给定字符或单词表达某一特定语义的最大可能性。选定的特征可以和文中的某些元素结合来识别一段文字,通过识别这些元素可以把某类文字同其他文字区别开来,比如垃圾邮件同正常邮件。以机器学习为驱动的分类方法将成为筛选的标准,用来决定一封邮件是否属于垃圾邮件。
因为语境对于理解“time flies”(时光飞逝)和“fruit flies”(果蝇)的区别是如此重要,所以自然语言处理技术的实际应用领域相对较窄,这些领域包括分析顾客对某项特定产品和服务的反馈,自动发现民事诉讼或政府调查中的某些含义,自动书写诸如企业营收和体育运动的公式化范文,等等。
将机器视觉、自动规划等认知技术整合至极小却高性能的传感器、制动器以及设计巧妙的硬件中,这就催生了新一代的机器人,它有能力与人类一起工作,能在各种未知环境中灵活处理不同的任务。例如,无人机、可以在车间为人类分担工作的“cobots”等。
语音识别主要是关注自动且准确地转录人类的语音技术。该技术必须面对一些与自然语言处理类似的问题,在不同口音的处理、背景噪声、区分同音异形/异义词(“buy”和“by”听起来是一样的)方面存在一些困难,同时还需要具有跟上正常语速的工作速度。语音识别系统使用一些与自然语言处理系统相同的技术,再辅以其他技术,比如描述声音和其出现在特定序列与语言中概率的声学模型等。语音识别的主要应用包括医疗听写、语音书写、电脑系统声控、电话客服等。比如Domino抯Pizza,最近推出了一个允许用户通过语音下单的移动APP。
上述5项技术的产业化,是人工智能产业化的要素。人工智能将是一个万亿级的市场,甚至是10万亿级的市场,将会为我们带来一些全新且容量巨大的子产业,比如机器人、智能传感器、可穿戴设备等,其中最令人期待的是机器人子产业。
机器人应用的分法有很多种,从应用层面可以粗略地分为以下几个类别。第一个类别是工业级机器人,像富士康这种公司已经运用得很好了,因为劳工成本越来越高,用工风险越来越高,而机器人则可以解决这些问题。第二个类别是监护级机器人,它可以在家里和医院里作为病人、老人或孩子的护理,帮助他们做一定复杂程度的事情。中国对监护级机器人需求其实更迫切一些,因为中国人口红利在下降,同时老龄化又不断地上升,这两个矛盾,机器人都可以帮助解决。因此,这个领域的需求在民用市场占比很大。第三个类别就是探险级机器人,用来采矿或者探险等,大大避免了人所要经历的危险。此外还有用来打仗的军事机器人等。
网络媒体Business Insider预测,机器人将在许多岗位上取替人类:电话营销员、校对员、手工裁缝师、数学家、保险核保人、钟表修理师、货运代理商、报税员、图像处理人员、银行开户员、图书馆员、打字员等。因为它们的价格竞争力惊人。麦肯锡全球研究院的研究表明,当中国制造业工资每年增长10%~20%时,全球机器人的价格每年下调10%,一台最便宜的低阶机器人只需花费美国人年平均工资的一半。国际研究机构顾能预测:2020年机器人将导致全球新一波失业潮。
同时,人工智能技术的发展还将让许多旧产业获得改头换面式的新生,其中最典型的是汽车产业。汽车产业已存在上百年了,其间的变革也是非常大的,但驾驶汽车的始终是人,可最近几年,随着谷歌等公司的大力投入,机器或者说某种自动化的系统已经有望取代人来驾驶汽车,从而形成一个市场容量巨大的新产业,即无人驾驶汽车产业。这个产业的规模也将是万亿级甚至是10万亿级的。而且,这个产业还将与新能源产业叠加、融合在一起,形成“车联网+能联网+互联网+电动汽车”的复合产业——未来,我们会把插电式汽车和氢燃料汽车作为发电厂使用,从而使新能源汽车成为电网的一部分,成为新能源的供给者,与现在一些装有太阳能发电系统的房屋是太阳能的供给者一样。
毫无疑问,与互联网一样,智能技术会向几乎所有旧产业渗透。华泰证券在一份人工智能产业的研究报告中提及了九大行业:生活服务O2O、医疗、零售业、金融业、数字营销业、农业、工业、商业和在线教育。实际上,将获得新生的旧产业还有许多,如军事、传媒、家居、医疗健康业、生命科学、能源、公共部门……甚至包括受VR/AR(虚拟现实与增强现实)技术发展影响而产生的虚拟产业。
如前所述,余凯博士提出了从万物互联到万物智能的三大趋势,并认为这在5~10年时间内就会成为现实:第一个是所有的设备都会装有智能传感器;第二个是所有的设备都有云端档案;第三个是所有的设备都会从以前的单一功能变成一个实际上是连接人和服务的节点。
而我们认为,智能化时代的到来,必然满足以下4个必要条件和4个充分条件。
智能化时代的到来有4个必要条件,它们是:移动网络的发展和传感器的普遍使用,云计算使低成本大规模并行计算成为现实,机器学习尤其是深度学习技术不断进步,大数据的发展。
(1)移动网络的发展和传感器的普遍使用
据TalkingData发布的《2014移动互联网数据报告》显示,2014年我国移动互联网产业发展迅猛,移动智能终端设备数已达10.6亿个,较2013年增长231.7%。全国各地的“移动侠”有着不同的生活习性,但他们的手机里都平均安装着34款APP。
而易观国际的数据则显示,2014年中国移动互联网用户规模约7.29亿,较2013年增长11.8%。未来几年,移动互联网用户规模将继续保持增长态势,但增速将放缓。从PC互联网到移动互联网,再到物联网,人与人、人与物之间的联系更加紧密了。
与此同时,传感器技术与产品的发展也有了长足的进步。20世纪90年代初,传感器的价格变得低廉且功能强大,这使工程师们开始相信传感器可应用的空间和途径几乎是无限的。来自美国麻省理工学院的技术倡导者凯文·阿斯顿提出了“物联网”这一概念,无生命物体可以通过全球网状网络与人或者其他无生命体进行交流。如今传感器已经遍布世界的各个角落,它们不仅能帮助矿工监测矿井内是否有毒气,而且能帮助人们了解自己的身体是否有异常变化。
2007年1月,史蒂夫·乔布斯推出苹果手机,作为首款成功配备触摸屏的移动设备,它包含微小的传感器,使用户可以向水平方向或垂直方向旋转屏幕,搜寻Wi-Fi信号或者与蓝牙耳机相连。该手机甚至还配有一个加速度传感器,用于在手机掉落时提供保护。现在,每部智能手机已平均配有7个传感器。
(2)云计算使低成本大规模并行计算成为现实
冯·诺依曼体系的串行结构使得计算机无法满足人工智能对硬件的要求,而近年来云计算的出现至少部分解决了这个问题。
从概念上讲,可把云计算看成是“存储云+计算云”的有机结合,即“云计算=存储云+计算云”。存储云的基础技术是分布式存储,而计算云的基础技术是并行计算:将大型的计算任务拆分,然后再派发到云中的各个节点进行分布式的计算,最终再将结果收集后统一处理。大规模并行计算能力的实现使得人工智能往前迈进了一大步。
云计算的实质是一种基础架构管理的方法论,是把大量的计算资源组成IT资源池,把动态创建高度虚拟化的资源供用户使用。在云计算环境下,所有的计算资源都能够动态地从硬件基础架构上增减,以适应工作任务的需求。云计算基础架构的本质是通过整合、共享和动态的硬件设备供应来实现IT投资的利用率最大化,这就使得使用云计算的单位成本大大降低,非常有利于人工智能的商业化运营。
值得特别指出的是,近来基于GPU(图形处理器)的云计算异军突起,以远超CPU的并行计算能力而获得业界瞩目。
CPU和GPU架构差异很大,CPU功能模块很多,能适应复杂的运算环境;GPU构成则相对简单,目前流处理器和显存控制器占据了绝大部分晶体管。CPU中大部分晶体管主要用于构建控制电路(比如分支预测等)和高速缓冲存储器(Cache),只有少部分的晶体管来完成实际的运算工作;而GPU的控制相对简单,而且对Cache的需求小,所以大部分晶体管可以组成各类专用电路、多条流水线,使得GPU的计算速度有了突破性的飞跃,拥有了惊人的处理浮点运算的能力。现在CPU的技术进步慢于摩尔定律,而GPU的运行速度已超过摩尔定律,每6个月其性能就可加倍。
CPU的架构是有利于X86指令集的串行架构,从设计思路上适合尽可能快地完成一个任务;对于GPU来说,它最初的任务是在屏幕上合成显示数百万个像素的图像——也就是同时拥有几百万个任务需要并行处理,因此GPU可并行处理很多任务,天然具备了执行大规模并行计算的优势。
现在不仅谷歌、Netflix用GPU来搭建人工智能的神经网络,Facebook、Amazon、Salesforce都拥有了基于GPU的云计算能力,国内的科大讯飞也采用了GPU集群支持自己的语音识别技术。GPU的这一优势被发现后,迅速承载起比之前的图形处理更重要的使命:被用于人工智能的神经网络,使得神经网络能容纳上亿个节点间的连接。传统的CPU集群需要数周才能计算出拥有1亿节点的神经网的级联可能性,而一个GPU集群在一天内就可完成同一任务,效率得到了极大的提升。另外,大规模生产促进GPU价格下降,使其更能得到广泛的商业化应用。
(3)机器学习尤其是深度学习技术不断进步
机器学习是人工智能的核心和基础,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。该领域的顶级专家Alpaydin先生对它如此定义:“机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。”
最近几年,新算法的发展极大提高了机器学习的能力,这些算法本身很重要,同时也是其他技术的推动者,比如计算机视觉。机器学习算法目前被开源使用,这种情形将促成更大进步,因为在开源环境下开发人员可以补足和增强彼此的工作。
在各种机器学习技术中,深度学习的发展尤其迅猛。深度学习的“技术路线”是模拟人类大脑神经网络的工作原理,将输出的信号通过多层处理,将底层特征抽象为高层类别,它的目标是更有效率、更精确地处理信息。深度学习自2006年由Geoffrey Hinton教授和他的两个学生提出后,机器学习有了突破性的进展,极大地推动了人工智能水平的提升。2013年,《麻省理工技术评论》把它列入年度十大技术突破之一。
人脑具有一个深度结构,认知过程是逐步进行、逐层抽象的,能够层次化地组织思想和概念。深度学习之所以有如此大的作用,正是因为它较好地模拟了人脑这种“分层”和“抽象”的认知与思考方式。
深度学习的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。因此,“深度模型”是手段,“特征学习”是目的。区别于传统的浅层学习,深度学习的不同在于:强调了模型结构的深度,通常有5层、6层,甚至10多层的隐层节点;明确突出了特征学习的重要性,也就是说,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,从而使分类或预测更加容易。与人工规则构造特征的方法相比,利用大数据来学习特征,更能够刻画数据的丰富内在信息。
深度学习使得人工智能在几个主要领域都获得了突破性进展:在语音识别领域,深度学习用深层模型替换声学模型中的混合高斯模型(Gaussian Mixture Model,GMM),使错误率降低了30%左右;在图像识别领域,通过构造深度卷积神经网络(CNN),将Top5错误率由26%大幅降低至15%,又通过加大、加深网络结构,将错误率进一步降低到11%;在自然语言处理领域,深度学习基本获得了与其他方法水平相当的结果,但可以免去烦琐的特征提取步骤。可以说,到目前为止,深度学习是最接近人类大脑的智能学习方法。
深层模型是包含多个隐藏层的人工神经网络,多层非线性结构使其具备强大的特征表达能力和对复杂任务建模能力。训练深层模型是长期以来的难题,近年来以层次化、逐层初始化为代表的一系列方法的提出给训练深层模型带来了希望,并在多个应用领域获得了成功。深层模型的并行化框架和训练加速方法是深度学习走向实用的重要基石,已有多个针对不同深度模型的开源实现,谷歌、Facebook、百度、腾讯等公司也实现了各自的并行化框架。
深度学习引爆了一场革命,将人工智能带上了一个新的台阶,将对一大批产品和服务产生深远影响。
(4)大数据的发展
过去机器学习的研究重点一直放在算法的改进上,但最近的研究表明,采用更大容量数据集进行训练带来的人工智能提升,超过选用算法带来的提升。举两个实例说明:①在语义识别方面,一个普通算法使用1亿个单词的未标注训练数据,会好过最有名的算法使用100万个单词;②将照片中的马赛克区域用与背景相匹配的某些东西来填补,从一组照片中搜索填补物的话,如果只用1万张照片,则效果很差,如果照片数量增加到200万张,同样的算法会表现出极好的性能。
换言之,大数据让机器不断学习成为可能,机器开始拟人化。
早在1980年,著名未来学家阿尔文·托夫勒便在《第三次浪潮》一书中,将大数据热情地赞颂为“第三次浪潮的华彩乐章”。不过,大约从2009年开始,大数据才成为互联网信息技术行业的流行词汇,进而成为一个产业,甚至是一个时代,即所谓的DT时代。其诱因是互联网产业的迅猛发展。根据IDC的监测统计,2011年全球数据总量已经达到1.8ZB(1ZB等于1万亿GB,1.8ZB也就相当于18亿个1TB的移动硬盘,人均200GB,这些信息的量可以填充572亿个32GB的iPad),而这个数值还在以每两年翻一番的速度增长,预计到2020年全球将总共拥有35ZB的数据量,增长近20倍。
美国互联网数据中心指出,互联网上的数据每年将增长50%,而世界上90%以上的数据是最近几年才产生的。此外,数据又并非单纯指人们在互联网上发布的信息,全世界的工业设备、汽车、电表上都有着无数的数码传感器,随时测量和传递着有关位置、运动、震动、温度、湿度乃至空气中化学物质的变化,也产生了海量的数据信息。因此除了互联网外,大数据的爆发在很大程度上还来自传感器技术和产品的突飞猛进。人类在制造数据和收集数据的量级与速度上将呈现几何级数的爆发式增长!
未来,随着互联网应用的进一步扩展以及传感器不断融入人类生活工作的方方面面,数据产生、收集的速度和量级将不断加速,人工智能的进化速度也将加快。
实现智能化的4个充分条件,分别是软硬件服务一体化、聚焦刚性需求、关键技术突破、体验式营销。
(1)软硬件服务一体化
软硬件服务一体化最典型的代表,莫过于日本电子产品巨头索尼。在21世纪初,索尼的PSP只能用索尼自己的音乐卡,而音乐卡只适用索尼自己开发的ATRAC制式。不得不承认,这样的封闭式生态系统的确为索尼攫取了大量利润,然而过于封闭的竞争策略和糟糕的用户体验,使索尼在与苹果的竞争中溃不成军。最主要的原因在于索尼将软硬件服务一体化视为圈钱的手段,忽视了软硬件的契合度与体验度,欠缺的正是苹果那样的服务精神与极致品质。
中国移动互联网产业联盟秘书长李易指出,软硬件融合其实并不是现在才发生的事情,5年前受谷歌成功的影响,已经有硬件厂商开始意识到软件的重要性。市面上曾经流行的功能机、汉王电子书都走的是软硬件服务一体化的路子。今天的代表则有整个苹果公司,亚马逊的kindle,微软的surface和XBOX,等等。
软件为硬件而编写,硬件为软件而定造,这是软硬件服务一体化区别于PC机时代的嵌入式硬件与系统的主要特征,它之所以能在今天被重新定义并重获新生,主要在于苹果告诉了人们什么叫极致、什么叫体验、什么叫生态。
由于智能产品的功能不同,运用的场景相异,所采用的硬件模块和传感器必然不同。相对应的,软件的深度定制成为行业的普遍趋势。然而定制化的软件还只是一层框架,内容为王的真理应当始终被贯彻。传统的服务内容包括视频、数字阅读等,新兴的服务内容则涵盖各行各业,如健身数据与在线课程,音频小说等。苹果的iPhone不仅整合了这些资源,更通过软硬件极致的融合度带给了用户极致的体验。
(2)聚焦刚性需求
智能产品必须满足人们的刚性需求,而这种刚性需求有两个层次:第一层次是人们对产品新功能的需求越来越多,而切中用户痛点的新产品会成为刚性需求;第二层次是原先人们即具有一些需求,而通过互联网的新平台、新技术、新应用能够更好地满足它们,并提供更棒的用户体验,比如苹果手机、特斯拉汽车等。至于智能手环、谷歌眼镜,由于我们以前没有这样的需求,用户接受起来肯定会迟缓一些。
刚性需求曲线在理论上是一条直线,即商品价格与用户购买意愿关系不大。确切地说,只有那些市场容量庞大、使用频次较高或单次市场价值较高的需求领域,才能称为刚性需求。刚性需求也是具有历史性、圈层性、发展性的,但最主要是符合人性和习惯的。而目前的智能硬件更加聚焦垂直市场的深层用户需求,另外随着人工智能的广泛应用,这些智能硬件将会更加主动地了解、掌握、适应用户的生活生产需求,渐渐地,用户将像依赖智能手机一样依赖这些智能产品。
(3)关键技术突破
科技是第一生产力,突破性的关键技术带来的不仅是工艺革新、生产率提高和产品功能创新,更能给用户以前所未有的绝佳的体验。例如,苹果手机能够一鸣惊人,其突破之处在于多点触控技术;再比如特斯拉汽车,它的特色在于BMS(电池管理技术),该技术保证了它的续航里程可以达到400多千米,而在此之前的电动车只能开到60千米、最多100千米,而且它们看起来就像一个玩具而非汽车。
科学技术带来的社会面貌革新,我们几乎无时无刻不在亲眼见证、亲身经历着。《连线》(Wired)杂志创始主编凯文·凯利将技术视为自组织、自发展、具有自身发展规律的另一种实体。技术从理论期到发明期,再到成熟商用期,都会经历一定的发展过程。而关键技术的突破往往带来的是科技范式的变革,这种变革往往是革命性的,甚至破坏性的。但基础技术的突破将在未来的一段时间内与其他技术相结合,更深刻的变革其他社会领域。人工智能技术、VR(虚拟现实)与AR(增强现实)技术、传感器技术等,都是会深刻变革社会面貌的关键技术。而值得我们兴奋的是,这些技术都在近年来有着较大的进步。
(4)体验式营销
每当苹果有新品发售时,苹果专卖店门前总挤满了排队的果粉与黄牛党。传统的家电零售商或许怎么都想不明白,为何一个二线城市或许只有一家苹果门店,但它的销售额和影响力却会如此之大,竟敌得过上千的店家的柜面。
这就是体验式营销的力量。传统展台往往只是产品展示与试用的陈列柜,而在苹果体验店内,你不仅可以自由探索苹果产品的魅力,更能享受到专业优良的服务。宽敞的大厅、明亮的环境、优质的服务、极致的产品,苹果用充满仪式感的美学元素冲击着人们的消费体验。自此,体验式营销成为智能产品成功的不二法门。
以线上销售见长的小米公司,也早已意识到线上线下相结合的重要性,小米不仅与迪信通签署了合作协议,而且其自建的体验店与服务站也遍地开花。世界智能音响行业巨头SONOS在进入中国市场时,也采取了体验式营销的做法,其于2014年在广州成立了中国区第一家体验店。
体验式营销最核心的本质就在于提供优良服务和减少价值减损。优良服务令顾客宾至如归,减少价值减损让顾客在购买之前就能够驾驭并使用产品,体味产品的精妙之处与实用之处。
此外,体验式营销往往能够树立品牌号召力、影响力,以少量门店带动大量顾客。线上线下相结合,一方面将门店开到家门口,另一方面又借助了互联网的强大传播力与影响,将两者形成合力,逐渐被大众消费者所接受和追捧。更为重要的是,在智能硬件被大众接受之前,这种互动式的体验式营销显得更为重要,它将带来第一批的核心粉丝用户,未来智能硬件的大规模推广将极大依赖于这批核心用户的酵化作用。