购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.2 互联网企业纷纷“圈地”人工智能

随着互联网企业纷纷“圈地”人工智能,在该领域一路高歌猛进不断开发出新产品,人工智能终于不再是实验室的试验品,而是成了出色的商业化技术代表。

从“人工智能”一词出现时开始,资本就对其表现出了无比的青睐。Venture Capital的调查报告显示,全球范围内与人工智能技术有关的公司,融资总额高达百亿美元,而这个数额还在不断上涨。

与资本市场相比,更加疯狂的是各大互联网企业。以苹果、谷歌、微软为代表的国外互联网企业从未停止过对人工智能公司的收购,国内的人工智能行业也在BAT的带领下积极发展。正如丁磊所说,“下一个10年的方向肯定是人工智能”,互联网企业在人工智能行业纷纷圈地的举动是为了能在这片未被完全开发的领域中占有一席之地。科技巨擘的野心恰恰证明了“得人工智能者得天下”的时代已经到来。

1.2.1 微软“小冰”:自然人机交互

微软“小冰”是微软人工智能三条全球产品线之一。它的提出是基于微软的情感计算框架设想,希望提供一个能够和人类在任何场景和地点进行交流的机会。通过微软的不断更新升级,“小冰”已经成长到了第五代,其在全球的人类用户数量已经超过1亿,发生的对话数据已经超过300亿轮。

“‘小冰’是一个聊天机器人,但又不仅仅是一个聊天机器人。”微软全球执行副总裁沈向洋表示,“聊天只是用户的一个体验,但我们设计产品理念的真正核心在于打造一个情感计算框架,同时拥有许多生存空间、辅助设备及相关设备,令‘小冰’能够与人类在任何地点及场景进行交流。”

已经成长至第五代的“小冰”开始与硬件设备相结合,从最初的情感陪伴角色转向家庭生活助手的角色,在人工智能的人机交互领域给出了新的方向。

人机交互(Human-Computer Interaction,HCI)是指人与计算机之间使用某种对话语言作为交互方式,完成人与计算机之间信息交换的过程。在计算机技术出现后,研究人员一直试图不断简化、更新人机操作的过程。在人机交互的探索史上,一共发生了三次革命:鼠标→多点触控→体感技术。

(1)鼠标

苹果公司设计的世界第一款大众普及鼠标“Lisa”是人机交互的始祖。由于鼠标在位置指示上比键盘更加人性化,人机交互的过程变得更加顺畅,鼠标渐渐成为计算机的标配设备。

(2)多点触控

苹果公司为人机交互带来了第二次革命性的进展。苹果公司研发的多点触控颠覆了传统的人机交互模式,为大众带来了全新的基于手势的交互体验。

(3)体感技术

Kinect被誉为第三代人机交互的划时代产品。在这个产品中,人机交互不再依赖任何手持设备,而是依靠即时动态捕捉、影像识别、麦克风输入、语音识别等功能实现交互。

北京邮电大学人机交互与认知工程实验室主任刘伟教授认为,人工智能的本质是“是(Being)+该(Should)+想(Want)+能(Can)+变(Change)”。所以,人机交互的本质是人机共在,即人的智慧和机器的智能共存,这才是未来人工智能的发展方向。

微软“小冰”等智能机器人的初始形式是拟人化的语音陪伴,但设计者的初衷并不是仅限于此。作为自然人机交互的窗口,智能机器人一方面帮助人类更好地完成任务,另一方面也让人类更好地感知世界。人机交互技术越出色,人工智能在人类生活中的用处就越大。

人工智能在人机交互技术上还有许多难题没解决,例如,要考虑用户的教育背景、生活技能等各个方面的差异,要匹配日新月异的界面技术,要考虑各国文化和民族的风格等,但微软“小冰”的一步步成长和其用户群的不断扩大,都在证明人机交互是现实的需求,是未来的发展方向。

1.2.2 苹果iPhone X:刷脸解锁

苹果手机的新品iPhone X不仅在外观上采用了新的全面屏模式,还取消了曾引领全世界智能手机变革的Touch ID(指纹识别感应器),启用全新的Face ID解锁,即刷脸解锁。Face ID的基本原理是通过红外发射器发射的红外线从人脸反射回来后被传感器读取并获取深度信息,使系统得知人脸的结构,从而识别开锁。

苹果的iPhone X运用的人脸识别技术并非是独家首创的概念。事实上,人脸识别的研究开始得很早,在20世纪60年代后期就已经有研究人员进行研发,到了20世纪90年代已逐步进入市场,且技术的准确率高达99%。而在各界都对此感到兴奋、准备大举研发时,有关该技术的负面新闻却频频出现。因此,该技术的发展一度搁浅,直到人工智能技术进入人脸识别领域,给人脸识别带来新的生机。

人工智能在进行人脸识别时拟合了人脸的识别函数,当用户完成脸部扫描后,内部软件通过对每一个像素点的数据进行分析计算,最终得出识别结果,确认是否为用户本人。人脸识别技术最让人担心的一点,就是它能否分辨出真人和画像的区别,以此保证只为真正的用户开锁。

中国人脸识别技术的领先企业旷视(Face++)科技副总裁吴文昊说:“人脸识别技术其实很安全,并不比指纹解锁要差。该技术是基于双目活体技术进行人脸比对确认身份,在确认身份之前,系统会通过软硬件结合的方法进行活体检测,可以有效防御冒用他人照片或视频盗用对方账号的行为。”“活体检测”就是用来识别确认摄像头所对应的对象是真正的活人还是平面图像的技术。

经过人工智能的深度学习,人脸识别技术有了实质性的飞跃。除了刷脸解锁以外,人脸识别技术还可用于刷脸支付。根据苹果公司官方报道,Face ID技术可用于Apple Pay(基于近场通信的手机支付功能),开启全新的刷脸时代。

虽然人脸识别技术在智能手机等终端上大放异彩,但它的运用远不止这些。图1-5总结了一些人脸识别技术已经或将要落地的应用。

图1-5 人脸识别技术的应用

(1)手机解锁

手机解锁已经在前文介绍过,此处不再赘述。

(2)刷脸支付

除了苹果的Apple Pay以外,支付宝也与肯德基合作在杭州万象城落地了全球首个刷脸支付商用试点。消费者在自助点单机下单后,只需扫描一下脸部并输入手机号就可以完成账单支付,整个过程不到10秒钟。相比排队等候付款,刷脸支付就要快捷方便得多。可以预见,未来“靠脸吃饭”将成为生活常态。

(3)远程实名验证

生活中为了保证安全,许多事务的办理都需要当事人实名验证身份。由于现实生活中这样或那样的原因,实地验证总是不够便捷,影响人们的日常学习和工作生活。利用人脸识别技术,可以避免远程验证原来存在的替代作弊的问题发生,让远程实名验证成为可能。旷视科技对此颇有发言权,该公司的人脸识别技术已经为全球累计2.1亿人实现了远程实名验证服务,解决了异地验证的大麻烦。

(4)安检等管理

在地铁站、火车站等人群密集的场所,安检等管理必不可少。现在安检的最常见做法还是人工值守,这种方法不仅需要人力支持,而且工作效率也不高。广州地铁的万胜围站、珠江新城站、嘉禾望岗站等已经安装了人工智能安检门,利用人脸识别技术和互联网其他创新技术实现快速的自动安检。

人工智能安检仪可根据互联网大数据,为具有良好信用的旅客提供快速安检服务。除了对乘客实施安检以外,人工智能安检仪还支持对乘客随身携带的小包裹进行安检,以此减少安检时间。人工智能安检仪的优势在于速度快、效率高,如果通过试验,将能够为安检等管理带来便利,提高重点区域的安全系数。

(5)公安领域的运用

利用人脸识别技术,公安机关的数据采集变得更加便捷,安防管理得到进一步的加强。旷视科技已利用人脸识别技术为多地公安系统提供实时警情数据服务,直接协助警方破获案件千余起,抓获、控制在逃人员超2000人;重庆市某公安分局使用商汤科技的人像比对系统,对嫌疑人的识别效率提升了200倍,在40个工作日辨认出了69名嫌疑人。

在人脸识别技术到来之前,指纹识别、虹膜识别等生物特征识别方式在生活中已经得到广泛运用,但由于其要求对象必须与仪器产生实际接触,因此在公安领域的应用存在颇多不足。而人脸识别技术保证“非接触性”,无须对方配合也可采集信息,大大提升了系统响应速度和使用便捷度,也降低了接触式辨别带来的疾病传播隐患等问题。

(6)娱乐应用

人脸识别技术还可用于娱乐。例如,智能相册可通过人脸识别进行照片分类,方便用户管理相册;“美颜”类App通过自动识别人脸为其“化妆”或“试衣”,推荐商品等。

从苹果手机的刷脸解锁延伸到刷脸安检、刷脸支付及公安部门远程监控逃犯,人脸识别技术正在逐渐为人们的生活带来新的改变。未来还可通过人脸识别技术将人脸和身份证一对一绑定,彻底解决唯一身份的问题。那时,人们的生活将不仅更加便利,而且身份信息也将变得更加安全。

1.2.3 百度:生迪智能音箱灯

作为中国互联网巨头之一,百度在人工智能领域取得的研究成果也不容小觑。除了对无人驾驶等技术的研究以外,百度还推出了和全球智能音箱灯开创者生迪共同打造的跨界合作战略新品——生迪智能音箱灯(简称“小迪”),这也是中国首款语音操控智能音箱灯。

“小迪”作为智能音箱灯,实现了语音交互、氛围灯具和智能音箱的完美融合,既能语音识别用户指令,还能自动根据周围环境改变灯光的亮度和颜色,为用户提供阅读灯、小夜灯、彩虹灯等多种灯光模式,满足用户在不同场景中对不同灯光的需求。

在人工智能领域中,百度在信息流、人工智能商业应用以及无人驾驶等方面都有十分深入的研究。在智能化终端产品方面,百度依靠对话式人工智能操作系统Duer OS不断实现产品创新。除了生迪智能音箱灯以外,百度还推出了两款智能硬件产品:小鱼在家VS1智能音箱和Aladdin智能投影吸顶灯。这三款产品都搭载了百度Duer OS系统,与用户以自然语言进行交互,实现智能化操控。

百度智能生活事业群组总经理景鲲表示:“我觉得Duer OS 3.0是一个里程碑式的提升。整个操作系统最重要的三个属性——交互的变革、全新的应用生态、打通商业模式闭环,基本上已经完成了。”换句话说,作为对话式人工智能交互系统的 Duer OS能够顺畅地实现人工智能的商业化落地,从研发到落地的周期大大缩短。

搭载百度Duer OS系统的“小迪”作为百度人工智能家居的代表,体现了Duer OS系统作为对话式人工智能平台的角色。这个平台可以放到不同的设备中,不断形成新的入口,为用户带来全新的人工智能交互体验。

除了“小迪”等智能家居硬件以外,百度也推出了低价的智能音箱“小度”。根据景鲲介绍,“小度”音箱的儿童模式尤其受小朋友欢迎,这让百度预测到对话式人工智能的平台体验在儿童群体中将会迅速发展。加上消费模式的升级,消费者在儿童教育方面的投入会不断加大,儿童群体必然是未来智能产品的重要目标对象。

以“小迪”智能音箱灯为代表的搭载Duer OS系统的智能终端产品,作为百度在人工智能时代的入口,用各种终端形式实现用户与机器的交互,让用户充分体验到智能生活的美好。事实上,百度的人工智能系统Duer OS也是当前唯一一个在交互能力、内容服务和商业生态上都进行全方位布局的智能操作系统,而且成功实现了商业闭环,为百度在物联网时代占领战略高地提供了极大的支持。

1.2.4 阿里巴巴:天猫精灵

在人工智能的“音箱战”上,阿里巴巴也不甘落后。阿里巴巴人工智能实验室曾推出旗下首款智能音箱——天猫精灵X1,内置第一代中文人机交流系统Ali Genie 1.0。在短短一年之后,阿里巴巴实验室就更新发布了Ali Genie 2.0系统,使天猫精灵在原有的语音交互技能的基础上具有了视觉认知功能。

对于第一代天猫精灵,用户只需呼叫一声“天猫精灵”,就可以召唤云端的Ali Genie系统提供服务。天猫精灵X1提供的服务除了作为音箱的播放功能以外,还提供其他智能服务,包括查询、娱乐、购物和工具四大类,四个大类还可划分为许多小类,各种功能应有尽有,如图1-6所示。

图1-6 天猫精灵功能示意图

天猫精灵X1不仅具有“听”和“说”的功能,还可以通过声纹识别技术分辨家里的每一个人。与其他智能音箱使用的语音识别技术不同,天猫精灵的语音识别采用了声纹技术。声纹技术是生物识别的重要识别手段之一,通过不同人的声音特征识别不同的人。天猫精灵利用声纹技术,根据声音条件的不同识别出不同的使用者,既保证用户在使用过程中的安全性和私密性,也让语音支付环节多一重安全保障。

用户在使用时先将自己的声音注册并生成独一无二的声音密码,与天猫精灵绑定后即可开启声纹购物功能。当用户说出类似“帮我订一份外卖”这样的需要付款的需求时,天猫精灵会要求用户念一串系统随机生成的无规律数字作为声纹校验。如果声纹校验结果确认是用户本人,天猫精灵就会从用户绑定的支付宝中扣款以完成这笔交易。

除了保证支付安全以外,天猫精灵的声纹校验还能够通过声纹识别在识别出不同使用者的身份后,根据每个人的兴趣推送不同的内容,实现个性化推荐。

Ali Geni 2.0系统不仅在Ali Genie 1.0系统的基础上做出功能的升级,还新增加了视觉认知功能。也就是说,Ali Genie 2.0系统不仅能够“听”和“说”,还可以“看”,实现视觉认知、多模态交互、情景感知等功能,如图1-7所示。

图1-7 Ali Geni 2.0的视觉认知功能

Ali Genie 2.0系统的视觉认知能力包括图像识别、人脸识别和物体检测等;多模态交互能力是指天猫精灵和用户之间实现如语音、图像、触摸等多种交互形态的融合,模拟人与人之间的交流方式;情景感知能力则是指天猫精灵基于用户提供的上下文环境、对话场景等自主学习,理解情景需求。

体现在产品上,天猫精灵的视觉识别能力表现在“火眼”上,其核心能力有两个:视觉认知和表情系统。视觉认知方面,天猫精灵火眼至少能识别117套图书、4万个药盒,实现为儿童阅读书籍、为老人阅读药物信息的功能;表情系统方面,天猫精灵火眼可以在显示屏上展现一些可爱的表情,以供儿童游戏使用。阿里巴巴人工智能实验室总经理浅雪介绍,未来天猫精灵还会具有“万物识别”等更多功能。

不仅如此,以Ali Genie系统为支撑的天猫精灵还接入了各个平台的生活服务,如Keep、优酷、高德地图、支付宝、虾米音乐、天猫超市、喜马拉雅FM、淘宝网、绘儿乐、飞猪、盒马鲜生等,这些第三方技能服务都将为用户带来更便捷的智能生活体验。

1.2.5 腾讯:腾讯觅影

腾讯公司将人工智能技术运用于医学领域,推出了首款人工智能与医学结合的人工智能医学影像产品——腾讯觅影。腾讯觅影是由腾讯“互联网+”合作事业部领导,结合了腾讯公司内部包括AI Lab(腾讯人工智能实验室)、优图实验室、架构平台部等多个顶尖人工智能团队研发完成的人工智能产品。腾讯影音把图像识别、大数据处理、深度学习等领先的技术运用在医学领域,帮助医生完成治疗诊断的工作。

腾讯觅影主要有以下两大功能。

(1)人工智能医学影像

通过计算机视觉和深度学习技术,腾讯觅影对各类医学影像(内窥镜、病理、钼靶、超声、CT、MRI等)进行学习训练,充分掌握各类病变的医学影像特征,能够有效地辅助医生诊断病人的情况,以及实现各种重大疾病的早期筛查任务。

(2)人工智能辅助诊断

依靠腾讯AI Lab的技术能力,腾讯觅影人工智能通过自然语言处理和深度学习,能够为医生提供病人诊疗上的决策建议,辅助医生更快、更有效地理解病案,提升诊疗效率。

腾讯觅影的人工智能辅诊诊断能力主要包括两大方面:诊疗风险监控系统和病案智能化管理系统。诊疗风险监控系统可以使医生的诊疗风险大大降低,避免误诊;病案智能化管理系统可为医生准确提取病案特征,同时输出结构化的病历,减少医生整理翻看病案的工作,提升诊疗和科研效率。

腾讯觅影在早期食道癌的发现和诊疗中表现出了良好的辅助功能。在没有人工智能辅助的条件下,我国早期的食管癌检查程序烦琐,检出率却不到10%。而利用腾讯觅影筛查的结果准确率高达90%,筛查操作却只需一个内镜检查,用时不超过4秒,这显然是一项对人类生活有重要意义的应用。

除了食管癌早期筛查以外,腾讯觅影技术还支持其他病种的筛查和诊疗,如早期肺癌等。利用人工智能技术,腾讯觅影有望解决早期食管癌等疾病的筛查难题,有助于消除各地区的医疗水平差异,为患者提供水平一致的诊断和治疗。

对于人工智能在医疗领域的应用,丁香园创始人李天天曾坚定地认为医生不会被人工智能取代,但他渐渐改变了想法。他说:“至少有两类医生在将来有可能会被人工智能取代,一类是影像科医生,另一类是病理科医生。这两个科室的医生有个特点——不见病人。”

在人工智能的医疗应用上,腾讯觅影的出现无疑是一个十分令人兴奋的事例。麦肯锡合伙人弗洛里安(Florian Then)曾分享过人工智能医疗在全球的发展现状和趋势,认为数字化医疗不仅要从国家层面进行医疗基础设施建设,还要把握好创新数字化医疗方案,既要解决个性化问题又要保证资本不扎堆;更进一步,这些应用应成为健康的生态系统。显然,腾讯觅影就是这种人工智能生态系统的具体表现。

1.2.6 IBM:智能沃森系统

科技巨头IBM公司在人工智能领域推出的产品智能沃森系统,可以说是十项全能。智能沃森系统和众多第三方平台合作,打造了一个在众多领域都能为人们提供帮助的人工智能平台。

在智能沃森系统的发布会上,IBM公司首席执行官罗睿兰(Ginni Rometty)强调智能沃森系统的目标在于改变企业的运作方式和人们的生活方式。“我们的目标是增强人们的智力。”罗睿兰说,“沃森是人和机器的结合,主要作用在于扩充人们的专业知识。它既可以是一位老师、一位医生,也可以是一位律师。无论你做什么工作,我们都能够扩展你的知识。”

起初,智能沃森系统的应用领域是医疗保健,与葛兰素史克、史泰博、美国癌症协会及克利夫兰诊所等有合作关系。之后,IBM公司引进了超过 10亿美元的投资,智能沃森系统学会的技能和工作能力越来越强。除了医疗保健领域以外,智能沃森系统在时装设计、个人助理、食物、兽医学、比赛分析、潮流追踪和商业分析等领域崭露头角,并产生了一定的收益,具体案例如表1-1所示。

表1-1 智能沃森系统的应用案例

针对智能沃森系统的各种应用,上海元趣公司CEO兼首席科学家、拟脑机器人之父吴义坚总结道:“IBM沃森的核心是‘知识渊博’,也就是具有海量的各个行业的知识库,在此基础上基于自然语言处理和机器学习,提供信息服务和决策辅助。它的人工智能体现在大数据的分析、挖掘和决策上,其目标是打造一个全能型的行业知识库平台,让更多的第三方开发者给它提供数据,调用它的引擎为用户提供服务。”

智能沃森系统的存在是人工智能为人类生活带来巨大改变的有利证据。随着资金的不断投入和深度学习的发展,智能沃森系统几乎在衣、食、住、行等各个领域都为人类提供了帮助。智能沃森系统还不能全面解决人类生活中的所有困难,但它确实证明了人工智能拥有无限的应用潜力,IBM的不断研究终会实现人类的人工智能生活。 9xnnKjy8h2Hra1ZTTjqGukR9+lbgXKL8Lf9+Prkw3G/jzBpCSSxspf3ilkKgz6cU

点击中间区域
呼出菜单
上一章
目录
下一章
×