文字出现以前,人们结绳记事。这种不够清晰的记载方式使人们对宇宙和世界的认知一直停滞不前。后来,人们发明了文字,世界开始清亮,宇宙不再混沌,人类的思维逐渐变得清晰。从这层意义上说,人工智能和文字一样,都是承载和提升思维的工具。文字推动原始社会走向文明,AI思维赋予现代社会更多发展的可能性。
基于人工智能的个性化学习方案让你在短时间内掌握更多需要的知识,基于人工智能的智能匹配社交帮你更容易找到灵魂伴侣,基于人工智能的房屋评价系统让买房不再是糊涂的选择,基于人工智能的战略规划让国家的发展充满了更多的可能性。可以说,AI思维是这样一种“修身齐家治国平天下”的思维方法。要想掌握AI思维,需要了解的事情有很多。我们不妨先从AI思维的要素开始,开启这段新的旅程。
人工智能早在1956年美国的达特茅斯会议上就被提出,但直到2016年,才开始被大众熟知,近几年才开始被普遍运用在社会生活中的各行各业。这是为什么呢?原因在于,以前很多人工智能所必需的要素还没有发展起来。随着互联网的普及,人们对于人工智能的研究更加深入,这几年这些要素有了突飞猛进的发展。那么,AI思维得以实现,需要依赖于哪些要素呢?
第一个要素就是大数据。
我们处在一个数据井喷的年代,无论是企业业务环节产生的数据,还是个人移动设备里面的数据,信息量都非常大,并且这个数据量在近几年呈爆炸式增长。如图1-3所示,根据智研咨询发布的《2017—2023年中国大数据应用行业市场全景调查及未来前景预测研究报告》,全球数据总量的年增长率将维持在50%左右;并预测,到2020年,全球的数据总量将达到40ZB(1ZB=1万亿GB)。我们想想20年以前,个人计算机里面的数据可能只有区区几十兆,而现在的数据都是以TB或者PB作为单位的数量级。我们知道AI思维建立在对数据学习的基础上,数据越多,人工智能学会的东西越多,人工智能做出的判断决策就越准确,越具有实用性。所以说,大数据的形成是AI思维的一个要素。
图1-3 全球数据总量统计图
第二个要素是模型。
我们的大脑由许多神经网络连接而成,每天能帮助我们做各种各样的决策。早期的人工智能模型包括人工神经网络,它本质上是对大脑,也就是我们自有神经网络的模拟。这种模型在20世纪80年代就已经被发明出来了,它能够帮助我们从数据中提炼出知识。而今我们在人工神经网络的基础上有了更深的研究,产生了一系列的深度学习模型,其实可以把深度学习模型理解为传统的神经网络模型的加强版。一般的人工智能模型随着数据量的增加,预测效果会提升,但很快达到瓶颈。而深度学习的预测效果随着数据量的增加,会持续提升。
深度学习强大的学习能力决定了它能够更好地模拟人类大脑的运算机制,它最擅长的是理解和识别图像、视频、声音、文本这样的数据。通过对图像进行深度学习,它实现了人脸识别,比如支付宝刷脸支付;通过对声音的深度学习,实现了音频自动转换为文字,比如讯飞听见能够一键录音转文字;通过对文本的深度学习,人工智能已经能够独立创作,比如微软的人工智能机器人小冰出版了原创诗集《阳光失了玻璃窗》。
深度学习不但能为人工智能提供技术支撑,其发展也为人工智能在各个领域的应用提供了无限的可能。ImageNet是计算机视觉领域很著名的一个图像识别竞赛,是该领域的“奥赛”。很多专家、学者都会参与,微软、谷歌、百度等科技公司也是该比赛中的佼佼者。在ImageNet竞赛中,随着深度学习的发展,图像识别能力有了很大的提升,从2010年到2015年这5年间,错误率从30%左右缩减到5%。5%的错误率已经基本上匹配了人对图像识别的错误率,这促进了人工智能在更为广阔的图像识别领域的应用。除了图像识别以外,语音识别的发展也依赖于深度学习。20世纪50年代,第一个语音识别系统Andry只能够识别10个英文数字;而现在,深度学习助力语音识别,应用于市场上的语音识别系统对普通话的识别准确率高达95%,百度、搜狗、讯飞的语音识别的错误率维持在3%,比人类识别语音5.7%的错误率更低,这为人工智能在语音识别的各个领域展开布局提供了强有力的支持。所以说,深度学习的不断发展也促进了人工智能应用的不断普及。
第三个要素是算力。
AI思维的实现需要很强的计算能力的支撑。我们想到计算能力,首先想到的可能是电脑、手机等智能设备,它们能提供一部分算力。对我们做人工智能来说,这样的算力是不够的。我们需要一个大规模的计算机集群,需要成百台上千台计算机连接在一起,进行大规模的运算。谷歌X实验室推出的谷歌大脑就是将16 000台计算机的处理器连接在一起,这样强大的算力使其具有强大的自主学习能力,成为全球最大的人工智能大脑之一。
除了计算机集群,算力还需要GPU的架构。GPU全称是Graphics Processing Unit,就是我们常说的图形处理器,是一种专门在电脑和移动设备上进行图像运算工作的微处理器。与之相对应的是CPU,即中央处理器,其功能主要是解释计算机指令以及处理计算机软件中的数据。GPU的架构有别于传统CPU的架构,能够很好地支持深度学习模型的运算。你可能对GPU这个名称很陌生,其实你可能早已接触过它。如果你是一名电子游戏爱好者,不管你玩王者荣耀还是和平精英,都需要GPU的支持来实现游戏中人物的移动及其他图像变换。GPU现在已经发展到了第四代,它提供的强大算力能够支撑人工智能的开展以及落地。
强大算力的加持,使人工智能有了更为广阔的发展空间。例如,2019年8月,人类在强大算力的支持下首次成功重建了果蝇大脑神经元的3D模型。果蝇一直以来都是生物学领域公认的研究动物,但为什么一直到2019年才建出第一个果蝇大脑神经元的3D模型呢?因为果蝇的大脑有10万多个神经元,要想建立一个完整的3D模型,需要强大的算力支持,而这个条件是先前并不具备的。2019年,在谷歌、剑桥大学以及霍华德·修斯医学研究所的合作下,研究人员将果蝇的大脑切割成7 042个40纳米的超薄切片,并用透射电子显微镜生成切片的图像。这些图像像素高达40万亿以上,数量共计2 100万张。数千块谷歌开发的深度学习加速芯片Cloud TPU(Tensor Processing Unit)为这些图片数据的处理提供了算力,最终才生成了人类历史上第一个果蝇大脑神经元的3D模型。
第四个要素是业务模式。
我们知道,人工智能要落地,必须在一个场景中去实践它。例如,在金融领域,传统上我们的银行机构只对征信良好的用户发放贷款,而征信记录不良的用户就得不到相应的贷款服务。单纯使用人力去判断一个用户的信用是件费时费力的事情,工作效率极其低下。但通过人工智能,我们能在很短的时间内对用户的信用状况进行分析和判断,决定是否向其提供贷款服务。这样不但减轻了银行工作人员的工作负担,还提高了工作效率。基于人工智能迅速准确且不知疲倦的特点,它还能为更多更大的用户人群提供贷款服务,扩大业务范围。基于这些人的大数据,通过人工智能模型和算力,还能对用户的信用状况进行分级,不但能够判断是否提供贷款,还能判断向这个用户提供多少金额最合适。人工智能为金融机构的工作提供了参考依据,这就是一种基于人工智能的业务模式。实际上,这样的商业模式,把传统的银行和金融机构的业务模式推广到了更大的用户群,帮助我们实现了普惠金融的理想。当然,除此之外,人工智能还能运用在更多的领域,还有更多的创新业务模式。正是因为有了这些创新业务模式,人工智能才能顺利地在各行各业落地,帮助企业产出价值。
如前所述,AI思维的基础在于数据,而核心在于模型,实现在于算力,应用在于业务模式。只有大数据、模型、算力、业务模式这四个要素同时存在,并行发展,人工智能的价值才能得以体现,AI思维才算完整。这是从具体要素角度对AI思维的阐述,下面我们从认识论的角度展开对AI思维价值的理解。
认识论是关于知识来源和知识判断的理论,认识论将人们的认识过程定义为DIKW金字塔,认为认识分为四个层次,如图1-4所示,最底下一层是数据(data),数据上面是信息(information),信息上面是知识(knowledge),知识再上面是智慧(wisdom)。DIKW金字塔的名字就是取了每一层的首字母组合而成的。在DIKW金字塔中,越靠下的层级包含的内容就越多,每往上一层,内容就比下一层更加凝练,更富有价值。原始数据虽然数量庞大,但有用的信息全都淹没其中。信息是由数据加工处理而成,信息在实践中被升华提炼产生了知识,而智慧又是对知识的凝聚总结,它是金字塔的塔尖,能够长久地影响人类。
图1-4 DIKW金字塔示意图
需要强调的是,所谓信息,指的是根据业务需求处理好的有特定意义的数据。从数据到信息的转换是传统信息处理中比较专注的领域,通过数据库系统和数据处理软件,把相对粗糙的数据转化为信息。而从数据和信息到知识,是AI思维所涉及的领域,这个转化过程与数据库运算不同,因为它不是机械的数据规整和变换,而是通过人工智能完成的,是认识层面一个巨大的跃迁。
AI思维的关键在于生成知识。你可能会问,人工智能为什么产生的是“知识”呢?首先我们要知道,知识就是人类对物质世界以及精神世界探索的结果总和,也就是对规律的总结。我们在前面讲过,AI思维中的模型可以类比人脑思维中的规律,也就是说,模型体现出来的就是知识本身。随着数据源源不断地更新,模型体现出的知识也会不断刷新,针对新的输入产生预测,为我们的决策提供支持。
著名统计学家拉瑟福德·罗杰斯(Rutherford Rogers)曾说过:“我们被淹没在信息中,急切需要知识。”互联网的发展使我们突破了时间和空间的限制,能够获得来自世界各地的信息。但在信息爆炸的今天,我们对信息的获取是呈平方数增长的,在获取大量信息的同时,我们无法辨别哪些信息是对的,哪些信息是有用的,产生了深深的“知识焦虑”。而现在人工智能做的就是把大量无序的信息变成有用的知识,缓解人们的“知识焦虑”。
在当代,数据是一种重要资产。数据反映了事物的原理和规律,当你找到它的规律后,就可以去预测未来的事情。如果将数据比作原油,那么人工智能就是从原油中提炼各种高价值产品的加工厂,它的重要性可见一斑。从数据中发现知识、洞察和规律,这本身不是一个新的概念,几百年前就有过这样的实践——譬如说,开普勒从几百页关于天体位置的数据中,提炼并总结出了天体运动的三定律,至今仍被使用。现在,在AI思维的帮助下,我们借助大规模计算的方法,从海量的数据中自动地学习知识和规律。那么,从实际应用的角度出发,作为一个数据驱动的决策框架,AI思维都带来了哪些价值?
首先,数据驱动的人工智能框架可以带来个性化的体验。人工智能可以根据用户的历史浏览记录、成交记录对用户的喜好建立模型,得出各商品或内容和用户喜好的相近程度,并把相近程度排行最高的商品或内容推荐给用户。例如,当我们进入一些购物网站,可能会发现许多这样个性化的体验,若你之前购买过衣服,它可能会给你推荐其他的搭配商品,若你之前购买过图书,它可能会给你推送同类型书单。数据驱动下的人工智能框架带来的个性化体验让网站不再千篇一律,网站给出的每一条推荐都是根据用户需求调整和优化后得出的,真正实现了千人千面的精准体验。对于用户来说,这样省去了他们检索的时间,还更加符合他们的需求,带来了更好的用户体验,对于网站来说,这样可以提高网站的浏览量、点击率,还能提高商品的销量。此外,人工智能带来的这种个性化体验也能为我们的生活提供更多的便利,带来更多的幸福感,例如现在的智能家居系统,可以提供自动控温等贴心服务,提升了家居的安全性、便利性、舒适性,并且环保节能,让你感觉到这就是最适合你的,为你量身定做的家。
其次,数据驱动的人工智能框架可以带来细粒度的行业策略。行业策略细粒度意味着企业的经营会更加精细化。例如,企业可以把一个产品的目标客户群简单地划分为一定年龄范围的男性或女性,但这样的客户群划分显然没有针对性。利用数据驱动的人工智能框架进行目标客户群划分,得到的结果更加详细,比如我们不仅可以考虑基于年龄、性别这样的因素,还可以交叉考虑包含更多维度,例如兴趣爱好、行为习惯等的目标客户群,从而得到细粒度的营销策略。以视频软件芒果TV为例,为了提高视频的点击率,芒果TV运用人工智能来判断向用户推送视频的类型和内容。比如,追求放松娱乐的白领一族会收到《快乐大本营》的相关推送,喜爱烧脑解密的年轻人群会看到《明星大侦探》的相关广告。而随着用户观看视频数量的上升,人工智能的推送方案也会更加个性化,细化到满足每一个用户的需求。与传统方式相比,人工智能提供的细粒度视频推送方案为芒果TV提高了30%的点击率,真正实现了精细化运营。
最后,数据驱动的人工智能框架可以带来知识和洞察。我们去学校或者从经验中可以学习到知识,而数据驱动的人工智能框架可以赋予我们持续高效地从数据中学习知识、挖掘洞察的能力。这些知识和洞察可能不是列在教科书上的条条框框,但却一定是从数据中实时地、最大体量同时也是最有效获取的,并能够运用于业务实践中。例如美国哈佛大学地球与行星科学系的布伦丹·米德(Brendan Meade)教授团队通过深度学习分析了来自世界各地的地震数据集,发现了余震发生的规律,在此基础上开发了一套能够预测余震的智能系统。这套系统为避免余震二次伤害,顺利进行灾后救援和恢复工作提供了很大的帮助。
AI思维不是捷径,但它却可以帮你更加快速地抓住事情的本质,找出用户的需求,洞察世事的发展,进行准确的预测,产出更大的价值。这是科学探索的目标动力,也是人类实践的追求所在。
著名的科技思想家凯文·凯利(Kevin Kelly)说人工智能是认知化。如果说电力化带来了人工的动力,那么认知化带来了人工的智能。大量的实践表明,在感知方面,包括视觉、听觉、语言理解等,人工智能可以接近人脑。前文已经提到过,现在的图像识别错误率已经控制在5%,基本和人脑识别错误率持平;在专业决策方面,在海量数据的支持下,人工智能甚至可以超越人脑。例如,在金融风控领域,通过人工智能输出模型的KS值(通常用来衡量风险识别有效性的一个指标),可以做到40%~50%甚至更高,有效地控制住风险。基于人工智能的快速信贷审批,效果可以超越传统的人工方法。在传统出版业,一个编辑编辑一本书至少需要一个月的时间,但全球最大的中文期刊网龙源期刊开发了一个人工智能编辑平台“知识树”,它是一个能够根据定义内容自动编辑图书的智能系统,可以在一天之内完成一本图书的编辑工作,极大地提高了图书编辑工作的效率,缩短了图书出版的周期。
AI思维是一种“数据驱动决策”的思维,它不怂恿你去追逐虚无缥缈的白日梦,而是教你学会用数据筹码四两拨千斤。不论你研究的是什么领域,从事的是什么职业,通过AI思维,你都能从数据中理出头绪,更加快速、直接、准确地预测出研究对象的行为或者结果。绳锯木断,水滴石穿,掌握了以小博大的AI思维,你不但是一个梦想家,也能成为一个真正创造价值的实干家。