数字化需要智能的算法,因为只有经过算法的处理,数据才能产生魔法般的智能。以AlphaGo为代表的深度学习在图像和声音处理方面获得了巨大成功,激发了普通民众对人工智能的期待。正如原油需要多次处理和加工才能提炼出高品质的成品油一样,数据只有经过算法的处理和加工,形成决策并触发实际的行动,才能真正产生价值。
在消费领域,推荐算法很容易预测和影响消费者的购买行为,然而工业场景的人工智能并不像消费领域那么成功,从原始数据到实际行动之间的链条太长了,需要很多决策的环节。要让智能化在工业场景落地生根,需警惕过度夸大智能的作用,深刻理解智能的边界,尤其是新技术采用后具有长程效用的延时反馈作用
,要警惕智能化的副作用。只有充分了解现在人工智能技术的特长与边界,根据应用的场景选择能满足需求的最低智能、恰到好处的适度智能,才能产生稳定而持续的智能化应用。
2015年,有人将数字化和智能化结合在一起,提出“数智化”的概念
。其中的“数”即数字化,代表获取信息的技术;“智”代表智能化,是基于人工智能加工信息、推理分析,形成决策。2018年,在阿里的推动下,“数智化”的说法越来越多。
虽然将两者结合拓展了“数智化”的外延,但数智化并不是基础性的元概念,而是对具体技术的提炼,不能囊括未来的新技术。广义的数字化可以作为一种元概念,既包含现在“数智化”的内容,也隐含未来的新技术,只要其特征一致,就是通过数字世界的活动改造现实世界。
值得注意的是,“数智化”的新概念要跟我们习以为常的“数字化”概念相区别。为了便于读者理解,本书采用“数字化”这一更普通的词汇,取其广义的含义,包括数字化、智能化、人工智能、工业互联网这类新型信息技术,尤其关注与工业技术的深度融合,以及对工业实践产生的实际影响和价值。本书更关注数据“价值的萃取”和“品质的升华”。从“数字化”到“数智化”的飞跃,实现了从“数智化”向“数质化”的转变,提升了工作品质和生活品质。
古希腊哲学家苏格拉底在法庭上申辩时说:未经省察的人生没有价值。类比苏格拉底的说法,我们也可以说:没有经过处理的数据没有价值。如果说“省察”是个人对经验的整顿,那么算法就是对数据的整顿。算法是解决问题的一系列指令,对数据进行加工和处理的过程代表着用系统的方法描述解决问题的策略和机制。
Pascal语言之父尼古拉斯·沃斯(Niklaus Wirth)写了一本著名的书《算法+数据结构=程序》,提出计算机科学中的一个很有名的公式:
软件=数据+算法
这不仅仅适用于计算机的软件,数据和算法也是智能的两个本质维度。如果将整个工厂类比为计算机的硬件,那么经营活动就是工厂的软件。数字化就是给工厂安装一系列更“智能”的软件,这些软件既包括数据,也包括算法。现代企业积累了大量宝贵的数据,但是这些原始的数据只是潜在的资产,被算法处理后,数据就变活了,似乎有了智慧。智能化的算法显化了数据的价值,真正的“智能”是算法和数据的有机融合。
图1-8显示了领域专家与大数据算法在“智能”的两个维度上的差异。专家往往是在小样本的数据上长期研发,仔细打磨。而在大数据样本上,即使简单的数据挖掘算法,也能表现出强大的“智能”。随着数据的采集、存储成本越来越低,大数据算法已经深刻地改变了人们的生活,如今日头条的新闻推荐、拼多多的购物推荐。
图1-8 领域专家与大数据算法的智能差异
然而,工业领域需要更严谨的算法,对准确性要求很高,并且要求可以解释。专家的经验经过提炼,可以成为更缜密的逻辑和系统性的深度思考。将顶尖专家的经验转化为算法模型,可以加速专业知识的流动。
人在不同的年龄会表现出不同的“智能”,见表1-2。刚出生时,能哭能笑就是智能;蹒跚学步时,迈出一小步就是智能。行动由小脑支配,而小脑是人类亿万年进化而来的重要智能,结构非常复杂,小脑的神经元数量比大脑还多。与老年人的睿智比起来,年轻时的聪明只能算是小聪明。放下小聪明,才能获得大智慧。
表1-2 人在不同年龄的智能表现
智能的表现多种多样,可以归纳为三个基本维度:运动能力、记忆能力、思考能力。每个人擅长的能力不同,在不同的人生阶段,关注的重点也不同。智能的发展有积累效应,随着经验的积累,思考的层次也不断提炼和简化。类比人类智能的三个维度,机器的智能也有三方面:行动、数据、算法。就像许多人读书的时候容易偏科一样,机器的智能发展过程也不均衡。早期的机器只能取代人的体力劳动,表现为自动运动的能力,如蒸汽机、内燃机、电机等。这些机器虽然功率很大,但需要人来操作,工业化需要大量的产业工人来操作机器。
第三次工业革命中的信息化,主要围绕信息的存储和计算。计算机虽然无法自动行动,但是可以提供信息给人,通过人采取行动。这个时期,人被“镶嵌”在更大的数据网络中。
第四次工业革命中的数字化,是机器智能的全面发展,机器能够记录历史的经验,并且自主决策。这个时期的机器智能,不仅能处理信息,还能自动地采取行动。
智能化的本质是系统自身具有感知、分析、决策和执行的能力。如图1-9所示,全面的智能包含三个要素:感知获得数据、算法形成决策,以及自动控制行动。在工业生产制造中,这三个维度具体表现为数据采集、算法决策和自动执行,形成智能制造的三个技术支柱。
图1-9 智能化的本质
数字化转型对很多企业是个新课题,将企业类比为人,将数字化的新课题转化为我们熟悉的问题,我们就能透过现象看到本质。企业与个人是同构的,理解人和企业的共性和差异,有助于我们更清楚地思考数字化转型的模式,反过来,借鉴企业管理也有助于个人成长。
围绕智能三要素,人的成长有三条道路:
● 情绪体验:自我观察,提高感知力。
● 思维训练:论证分析,提高认知力。
● 知行合一:身体力行,提高行动力。
只有三条道路中的三个能力整体提升,人才会产生真正的自我。三条道路有机协调,才能应对波动,拥有稳定的自由意志,才能抵御外在不确定性的扰动,去除内心杂念和紧张的干扰。
企业的数字化转型是为了应对竞争环境的不确定性。面对更不确定的甚至动荡的生存环境,企业需要通过数字化提升自我。数字化的目标是适应更加动荡、不确定的环境,通过更数字化的方式增强感知、认知和行动的智能,提升企业应对不确定性的定力。
自我提升的三个能力(感知、认知、行动)也是企业转型要提升的能力,表现为以下三点。
● 感知数量化。
● 认知智能化。
● 行动价值化。
我们不能狭隘地把智能等同于智力、智商。洞察智能的本质,需要在智能主体的生存系统中考察,智能是生命体维持生存的基本功能。为了应对复杂多变的生存环境,生命体进化出复杂的感官,通过感知信息、加工信息来更好地维系生命的存在。生命体完整的智能,包括三个前后衔接的要素,如图1-10所示。
图1-10 生命体完整智能的三要素
企业也是一个生命体,企业的数字化转型类似于生命进化的过程。企业的数字化也包含感知、认知和行动这三个要素。数字化技术和人工智能的发展日新月异,根据技术所在的维度可以绘制数字化技术的雷达图,沿着三个维度可以方便地跟踪技术的进展,如图1-11所示。三者的最短板形成图1-11中的内圆,决定了整个系统的智能水平。有些技术即使本身看起来很普通,但作为突破内圈智能水平的最后一块拼图,也是极为有价值的核心技术。
图1-11 数字化三要素的技术雷达图
人的智能由三方面组成:五官的感知、大脑的分析、四肢的行动。任何智能体,也都包括感知、认知和行动这三个环节。数字化驱动的业务包含三个模块:采集数据、分析数据、闭环执行。其智能化分别对应感知智能、认知智能和行动智能。
更多的信息量可以提升智能水平,在工业场景中增加传感器,让设备具备感知能力。能听能看,就能自主行动。增加通信网络,让工厂内的机床可以联网,工厂外的施工设备可以连接。对比、汇集不同渠道的数据,可以发现很多潜在的问题。
人与人之间智能的差别并不体现在五官的感知能力上,而是体现在思考能力上。工业数字化的价值,来自从数据中挖掘出的价值。如何从大量数据中挖掘出有价值的信息,并形成有效的决策,是智能化的关键。
人工智能很难直接应用在工业领域。基于统计方法的人工智能,其结论难以解释,不容易被人理解。人工智能的连接主义学派,在底层模拟人脑的神经网络,很不直观。同时,工业领域对算法的要求更高。
人的思考似乎更加简洁,把繁杂的数据提炼为符号,并在符号的基础上进行推理,聚焦于核心的逻辑推理。在人工智能的发展中,符号主义学派试图通过模拟人的认知过程,进行符号推理,但是比较困难。目前比较可行的做法是结合专家经验。如何让专家经验与机器算法融合,是工业智能化的关键。
近些年,人工智能越来越关注可解释的因果推断。图神经网络发展迅速,让人们看到了可解释人工智能的曙光,但是由于太前沿、太复杂,工业领域的专家很难理解。相信随着这方面学术研究的进展,很可能会形成与专家知识相融合的框架,从而被工业界采纳。
人的行动靠小脑控制,婴儿学会了走路就内化为肌肉记忆,平时不引人注目,但是生病后失去行动能力时,才会感叹自由行动多么重要。
企业的行动靠流程,正常运作时不引人注目,但是遇到转型和变革时,流程会表现出强大的反弹和阻力。是实现数字化转型和业务变革,还是维持流程和业务稳定?数字化转型中要特别关注落地执行中的困难,再高明的决策也要靠执行落实。执行力是战略的一部分,缺少有效的执行力,就无法分辨真的智能和假的智能。
是否可以用数据量衡量是否实现了“数字化”?不同数据的含金量是不一样的。工厂的设备每天可以产生TB级的数据,如果都存储下来成本很高,而且其中大量的数据并没有多少价值。异常运行状态下的数据量不多,但是价值可能巨大。
如何评价数据资产的价值呢?量化数据中有价值信息的含量,可以参照知识管理的DIKW(Data,数据;Information,信息;Knowledge,知识;Wisdom,智慧)模型,如图1-12所示。不同含金量的数据处于金字塔的不同层级。最下层是原始的数据,虽然数据量大但价值密度低。把数据与业务场景结合,进行加工会形成有意义的信息。综合各方信息,形成决策和判断,数据才真正产生价值,这就是知识的力量。
我们可以从存储和计算两个维度理解DIKW模型,如图1-13所示。纵坐标反映了计算方式和复杂程度,越高层级的智能,计算方式越复杂。横坐标反映了存储方式和数据的广延属性,不同层级的数据量不同。为了有效地传输与存储,原始的数据可以本地存储,而加工后的信息和知识可以跨区域流动。
图1-12 智能的DIKW金字塔模型
图1-13 从存储和计算两个维度理解智能的DIKW模型
要推广成功的经验,或者吸取失败的教训,就要积累大量具体场景中的信息,分析和提炼出普遍的共性,归纳为体系性的结构化知识。从数据到信息,再到知识,相当于一个学习好的学生利用自己的聪明才智做成一件事情。最高层的智慧,不能只单方面学习好,而要全面发展。智慧超越工具理性,在于如何选择对的事情去做,这超越了现在图灵机的计算智能,目前还离不开人的意志和价值选择。
数字化更本质的探寻,涉及信息的本质。当缺乏信息时,未知的空间中一切皆有可能。信息可以减少未知的可能性空间,可以视作整个选择空间中“不确定性”(被动的感知空间)或“选择的自由度”(主动的调控空间)的度量。消除不确定性的,不是数据、消息本身,而是数据所包含的意义。智能是浓度更高的信息形态。
图1-14展示了不同层级和形态的智能。信息减少了可能性空间的不确定性,不同形态的智能构成了可能性空间的边界。数字化、智能化拓展了可能性空间的约束边界,减少了可能性空间的不确定性。
图1-14 不同层级和形态的智能
控制论更深入地研究了感知的层次,将智能的普遍规则细分为强度、感觉、构型、转换、时间、关系、范畴、序列、程序、原则和概念共11层
,目前工业领域的数字化普遍处于前两层。
为了更深入地思考智能的本质,我们需要回顾人工智能学科诞生之初奠基者的很多争论。比如,图灵和香农关于智能的本质就有不同的理解,图灵认为人是由物质构成的,人的智能可以用物质的系统来承载,因而提出可计算的模型——图灵机,它构成了现代计算机的雏形。
无论基于神经网络的机器学习,还是关注语义符号的逻辑推理,都是在计算机上的计算,底层逻辑是图灵机,只能解决可计算的问题。然而,有些巧妙的决策不见得能量化计算,很多高超的智慧超越了精打细算。哥德尔提出不完备定理,指出逻辑自洽的系统必然存在边界,图1-15展示了不同智能的边界。
图1-15 不同智能的边界
人的智能显然不仅体现在计算和逻辑上,情感、意志等都是智能的体现,是人明显区别于其他动物的特征。不能实现情感的智能,难以超越人类。马文·明斯基在《情感机器》一书中写道:“如果机器不能很好地模拟情感,那么人们可能永远也不会觉得机器具有智能。”