人类社会的发展历史,可以毫不夸张地说,就是人类不断地抽象、总结、应用知识的过程。人们观察世界、研究世界、制造工具、改造环境,贯穿于这一切行为之中的,就是知识。而模型,则是人类用来描述知识、传递知识,并进一步应用知识的最有效、最直接的手段。
在人类对世界的认知研究过程中,学者们提出了各种理论模型来阐述我们的认知世界,例如20世纪60年代卡尔·波普尔的“物理世界、精神世界、知识世界”学说,21世纪初期世界经济论坛创始人克劳斯·施瓦布提出的“物理世界、心理世界、人工世界”,王飞跃的平行世界理论,以及《三体智能革命》一书所阐述的三体智能模型。
综合先前所总结的种种认识模型,我们不难发现,它们都不约而同地阐述人、机(系统)、物之间的相互作用与促进的关系。而在这些世界之间所交互的,基本可以用两个词来概括:知识,模型。
人类与自然界不断交互的发展历史,完全可以用“知识积累、创新改进”这八个字来描述。人类自古以来就不断地观察客观世界,获取关于客观世界的各种信息。人类运用自己独有的智慧不断分析、总结、抽象这些信息,形成了人类关于外部事物的认知。这些认知的结果,我们称之为知识。从最简单的知识,例如锋利的石头可以轻易地划破动物的皮毛,到复杂的数学、物理学,乃至于神秘的量子科学,人类经过漫长的发展阶段,形成了复杂的自然科学体系。与此同时,人们也从未停止对人这个掺杂了看不到摸不着的“意识”的物质对象的思考和研究,由此而产生的,便是社会科学体系、哲学精神学说。
而利用由从质朴到繁杂的知识体系,人类通过“创新”不断地改造物理对象,从石刀、石斧,到宇宙飞船与量子计算机,将我们所生活的物质世界不断改造为更加适合我们生存、发展的现代化的世界;同样的,也建立了从简单到复杂的社会运行机制,包括政治、经济、社会等系统,用来运转日益复杂的人类社会。
在20世纪40年代之前漫长的人类历史中,知识积累与应用的不断迭代、演进基本上就是物理对象与人的意识在不停歇地共轭交融的发展过程。人类为了交流,发明了语言、文字,为了记录各种科学体系,发明了数学符号、方程式。
电磁理论是人类发展历史中最重要的知识体系之一。20世纪40年代,当逻辑电路被发明出来之后,计算机便以势不可挡的势头进入了人类的世界!从最简单的逻辑电路到复杂的人工智能系统,从最简单的代表开关状态的0和1,到复杂的仿真模型,计算机技术在短短的不到一个世纪的时间内,发展到了让人瞠目结舌的地步。
而知识建模,则是这个发展过程中最重要的一个环节。数字世界是由海量的0和1组成的,这就决定了只有结构化的信息才能够被数字化从而进入数字体当中去。不管是一个简单的数学公式,还是一个复杂的经济体,建模成了数字化的最基本的前提。
数字世界最基本的承载体——计算机,最擅长的事情就是计算,这也是人类发明、发展计算机的最原始目的,即帮助人们进行计算。而随着存储技术与网络技术的发展,记忆与传播也成了数字体的最强大的能力。计算机便运用自己无比强大的计算、存储与传输能力,帮助人们完成人脑无法完成的海量的计算工作,将结果反馈给意识人,从而达到学习提升的效果。
CPS可能是关心工业的人们这几年里最为耳熟能详的关键词之一。在《三体智能革命》一书中,对数字体与物质体之间的相互作用选用了这样八个字来描述:“知识驱动,回馈优化”。工业现场的信息通过物联网和数据采集系统输入计算机中,由计算机完成自己最擅长的事情:计算模拟,而被转化为数据结构和软件的知识模型,则是这些计算和模拟的基础依据。这些计算的结果,通过机电连接的模块转换为电磁信息,便可以控制物质体(例如电动机)运动变化,从而达到以知识驱动物体的目的。而物联网的发展,则使得物质体的各种状态参数得以及时准确地被采集到计算机中,形成数据,供数字体进一步地进行计算与模拟,再形成一个完整的闭环。
三个世界最终形成的,是一个不可分割的整体体系。而知识、建模,便是这个完整体系中贯穿始终的核心要素,也构成了我们在这一讲中所要讨论的企业信息化最基础的理论体系和依据。
可以说,智能制造下的企业信息化架构,组织管理和人才体系的建设,本身就是一个三体模型框架中的知识、模型、数据、系统的不断相互作用、不断发展的过程。
(1)信息 人们观察客观世界,会获得大量的信息。所谓信息,就是人类关于客观世界的直观描述,是人类对世界的最直接的认识(图5-1a)。
图5-1 信息、知识、智慧示意图
(2)知识 知识应该是人类认知世界所获得的各种主体(兔子、草、雨水、土地、狼等)之间的相互作用关系的模型化的总结(图5-1b)。
(3)智慧 智慧或许应该定义为一种能力——一种将不同的认知目标主体之间的关联关系描述出来的能力。尤其是当两个“体”本身并不直接关联,或者其关联无法用人类的感官所捕捉到的时候(例如:物体之间的万有引力,狼与土地的关系),通过推理、想象、总结等意识人所具有的独特的认知能力,找出这些隐性关联模型的能力之大小,便反映着一个人智慧水平的高低(图5-1c)。
著名的DIKW模型(图5-2),便是描述这几个概念之间的关系。
图5-2 DIKW模型
数据本身并没有含义,比如,90是一个数字,本身并不能说明任何问题。而当我们说:90是一个温度值(90℃)的时候,我们就有了一个直观的印象。然而,这个具象化的数据又能说明什么问题呢?我想我们并不能从这个信息中找到什么更多的含义,就是一个温度值而已。但是,如果我们说,一杯水的温度是90℃,这便成了一个非常具象化的信息:一杯温度为90℃的水。
人体的正常温度在37℃左右,这是我们知道的另外一个信息。那么如果这杯90℃的水被人喝下去,会发生什么?由于水温过高,会让这个人烫伤。这便是人们在观察实验的过程中所总结的知识:人与热水之间的关系。
知识的总结产生需要智慧,新知识的推导则需要更高的智慧。虽然计算机的出现极大地加速了知识生产的效率,但是到目前为止,意识人,仍然是知识的唯一来源。
人类观察客观世界,获取的信息经过人类的意识加工(认知),形成了对客观世界的印象、看法,以及人类对外部世界的期望,形成知识。为了使知识能够被记录,人类创造了各种不同类型的模型。一个工程设计图是一个模型,一个流程是一个模型,一个对象关系图也是一个模型……
知识建模,是数字化的基本前提。计算机的世界,是0和1的世界,这就决定了数字体的世界是一个只能容纳结构化信息的世界。我们今天在这里所要讨论的,主要便是为了数字化、信息化而创建的结构化模型(图5-3)。
图5-3 外部世界到数字世界的建模
有一个经常被问及的问题是:人类所创建的模型,描述的是什么?绝大多数时候,人们会说:模型是人类创建的,所描述的主要是外部的物质体。这似乎很对,一个设备的3D模型可以用来描述这个设备;一个飞机的模型,描述的是一架飞机,不是么?
然而,我们不难发现,模型与现实总是存在着这样那样的偏差,并不能完整全面地描述客观世界的物质体。为什么?
为了更好地回答这个问题,我们不妨思考一下,模型究竟是在描述什么?
通常建模主要在以下三个领域进行:
(1)主体特征 人类的认知,通常会产生很多不同的认知目标主体。目标主体可能是客观存在的一个物质体,比方一架飞机、一个苹果、几台机床等。用来描述物质体的主体特征,则包括属性定义、属性值的限制规则等。这些特征所组成的主体模型,代表的则是人类对单个物体的认知与理解。
(2)关联关系 不同的认知目标主体之间存在着错综复杂的关系。例如:万有引力可能是所有的物质体之间不可避免的最基础相互作用关系,火车(认知目标主体)有很多轮子(认知目标主体),火车头(认知目标主体)会拉动车厢(认知目标主体)移动等。而关联关系,则是人们用来描述不同事物主体之间的关系以及相互作用规则的模型元素。
(3)变化过程 目标主体之间的相互作用关系,所带来的后果便是认知目标主体的不间断的状态变化,这是变化过程与前两个模型元素完全不同的地方:变化过程是一个时间轴上的概念。从这个角度上来建模,便可以用来表述在物质相互作用规律与外部条件作用下,事物(或者事物集合)随着时间变化而不断变化的状况。
认知目标主体可能以一个现实中存在的物质体作为原型,例如机床、零件、汽车、背包;也可以是人类在意识世界中虚构的一个对象,例如一个卡通人物、一个还在设计过程中的产品、一个虚拟的概念模型,或者一笔交易、一个流程,等等。
当我们建立模型的时候,针对三种不同的模型内容,很无奈地发现:原来我们完全无法建立一个客观世界的完备模型,通过我们的意识加工后形成的模型,尤其是在进入赛博世界的时候,都存在着失真。
(1)本体失真 没有一个数字模型可以无失真地精准映射现实世界的生命体的整体或者局部特性,与其所对应的生命体相比,一定存在失真性。数字体所映射的,是意识人世界从某一个视角上对现实生命体的认知。
(2)关联缺失 没有一个数字模型可以完整地描述一个事物的所有相关因素,其所代表的,都是意识人建立的近似或者理想关联模型环境,包含很多显性的、隐性的未知、假设与忽略。
(3)过程断裂 没有一个数字模型可以完整地包含一个生命周期变化过程中的所有过程状态,其所包含的,都是在一定的采样频率下所采集的断裂的序列时间点上的状态信息。
总而言之,我们可以再次来尝试回答这个问题:人类所创建的模型,描述的是什么?
建模,是用系统的方法与手段来描述意识人的认知结果,可以是人对外部世界的认识所产生的认知对象,也可以是人类在意识中想象、推理、设计而成的并不映射外部世界的纯粹想象的认知对象;抑或是两者的结合。
在现实世界中,建模并不是一件容易的事情,建模的现实失真特性又是我们在建模过程中无法避免的一个问题。那么,如何保证我们所建立的不完整模型能够解决现实业务活动中所面临的问题?
通常而言,在方法论的层面上,通常可以从问题域与因果链两个方面去考虑。
问题域(Problem domain),是指目标问题的范围、问题相关元素之间的内在关系和逻辑可能性空间。在一个特定的问题域中,我们所关心的仅限于与我们需要解决的问题相关联的知识元素与应用领域。比方说,在开发一个建筑的门禁系统时,我们一般不会过多关注通风系统的整体设计与布局,也不会关心建筑物内窗帘、油漆的选择,而只会关心与门禁相关的网络、电力、通道布局等信息。
一个大的问题域,往往可以分解为相互关联的多个子问题域,在建立相关模型的时候,在关心问题域范围内的各种相关元素的时候,还需要在更高的一个抽象层面上,分析清楚不同的问题域之间的关联性。多数情况下,相邻问题域与目标问题域的关联元素,有可能成为解决问题时的输入、输出等相互作用的关系。
同样以智慧建筑为例,门禁系统与供电系统、照明系统,会产生明显的关联。那么,门禁系统所需要的电力供应,便成为一个重要的输入条件,而这些相关的电力供应需求,也会成为建筑物电力系统设计中所需要考虑的一个输出。
问题域的分解,使得我们有能力把一个复杂的问题分解简化为多个问题来处理,从而有效地降低建模的复杂程度。不难想象,问题域越简单,建立相对完整模型的难度会越低。
图5-4中的老师傅烧窑,我们希望能够用模型来表示其不断拨动木柴的过程规律,以便于用系统的方法来控制炉火。但是,烧窑的老师傅是根据什么规律来通过拨动木柴而调节炉温的呢?恐怕目前我们还没有办法来针对这个过程建立变化过程规律的模型,甚至于老师傅自己也完全没有办法总结出来一个可以模型化的规则供我们来建模。事实上,烧窑师傅经过漫长的岁月成长为一个烧窑的大师,其结果,往往使得他会依靠直觉来告诉自己该如何去调整木柴调节炉温。
图5-4 因果链上的建模
这种情况下,我们无法针对木柴调节来建立模型,那么我们可以通过测量的方法,建立起炉温的温度曲线模型,而通过可控的温度调节手段(电、气等)近似地达到我们想要达成的结果。
转换思路:我们往往需要去思考事物的相互作用关系,从事物发展变化的因果链上来寻找其他的建模对象来达成我们的目标。