购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.2 熵减:数据“能量”引入新秩序

前面讲到,随着大数据技术和互联网技术的普及应用,数字经济进入了加速发展的时期。那么,本节将要讨论为什么数字化转型这么重要,数字化转型的底层逻辑是什么,以及基于数字化的业务创新思路。本节引入了“熵”的概念,用“熵”来解释为什么数据能够重塑业务形态,并发挥业务价值。

1.2.1 从熵的角度看数据价值

1.熵与信息熵

1)熵

“熵”是一个用来衡量系统状态的定量指标,这个概念最早被德国物理学家克劳修斯于1865年提出。“熵”值可以反映一个系统状态的“混乱”程度,当一个系统所处的状态的不确定性越大时,这个系统的“熵”值也就越大。“熵”字的偏旁是一个“火”字旁,实际上暗指这个概念其实和热力学领域的理论是相关的。“熵”的概念与热量、能量的概念是分不开的。根据克劳修斯的能量公式:

“熵”的变化过程对应着能量的输入过程,通过给一个系统输入能量,可以让一个系统的“熵”发生变化,让“熵”值下降。可以通过能量引入“负熵”让这个系统的状态更加有序。不管是社会系统还是物理系统,人们总是追求系统的秩序,而讨厌发生混乱。只有在有序的系统内部,人们才能合理地制定管理策略,有效地引导事件的未来发展和变化,让系统中的各相关方从中获益。

混乱的系统本质上意味着业务目标对象的不确定性。以“能量”的形式来减少业务对象的不确定性是保障产业经济活动综合效能的基础。如果向业务系统注入“能量”,则可以降低市场需求的不确定性、用户消费行为的不确定性、金融投资产出的不确定性、健康状态的不确定性、交通路况的不确定性,以及生产车间各个设备运行状态和产品质量的不确定性。通过引入“负熵”增加业务系统秩序的效果如图1—5所示。

图1—5 引入“负熵”增加业务系统秩序

那么这个“能量”到底应该如何获得呢?在数字经济的模式中,答案就是通过信息来获得“能量”。知己知彼,方能百战百胜。在开展任何工作时,聪明的决策背后一定掌握了必要充足的信息,而信息又必须从数据中来,反过来也可以说,数据是信息的表现形式与内容载体,因此,如果要让业务更加有序,就必须充分利用好数据资源。于是,获取数据、分析数据、使用数据做决策就成了推动业务发展的关键活动。

2)信息熵

如果以信息的视角来解读“能量”,则可以把熵的概念拓展到信息熵的概念上来。信息熵是指信息源的各可能事件发生的不确定性。20世纪40年代,香农借鉴热力学的概念提出了信息熵的明确定义和公式表达:

在一个指定业务系统中,为其提供必要的数据资源就可以降低系统中重要变量的信息熵,让系统能够产生业务目标相关的更高期望收益。数字化的目的就在于让业务系统越来越透明化,通过数据更直接地搞清业务的底层规律。当人们掌握了这些规律后,就可以对原有的业务系统进行重新设计,结合业务目标有针对性地构建一个更加可控的业务系统。此时,新系统将比原有系统更有秩序!

2.数据、信息、知识与智能

数字化成败的关键在于对数据的有效利用。提到数据,往往会和信息、知识、智能这些概念联系起来。那么这些概念之间又是什么关系呢?充分理解这些概念之间的联系和区别,有利于更好地了解数据的本质,并看懂数据的价值。

1)数据

数据是人们从客观世界中可以直观可见的原始内容素材,这些素材可以被直观地采集、表示、存储和传播。从数据结构的规整程度来看,包括结构化数据、半结构化数据和非结构化数据。

结构化数据主要是指电子表格中的数据,在同一张表格中,数据的结构和内涵都是统一的;非结构化数据包括文本、图片、音频、视频等多种形式,数据的表示形式及自由度较高,含义也比较隐晦;半结构化数据的规整程度在结构化数据和非结构化数据之间,通常这些数据会有相对规整的结构,但是数据结构的内部信息要素表达又相对自由。网页数据是非常典型的半结构化数据。从数据到智能的层级递进关系如图1—6所示。

图1—6 从数据到智能的层级递进关系

2)信息

信息是原始数据被加工后的结果,信息的具体表现是数据在统计意义上的分布特征或变化规律。例如,信息可以是数据在特定维度的统计指标,或基于数据使用算法抽象出来的数学模型。信息是数据的粗加工结果,是从数据中提炼出来的最直观的内容。数据中所含信息量的大小是可以被量化的,例如基于信息熵变化的形式。信息的质量可以被客观地进行评估。

3)知识

知识和具体的业务主题是密切相关的。知识有一定的主观特征,对于同样的信息,从不同的业务主题视角去解读,可以提炼出不同的知识内容。知识包括事实类型的知识和规律类型的知识。事实类型的知识可看作静态知识,规律类型的知识可看作动态知识。知识相比信息的抽象程度更高,价值密度更大,同时价值属性也更加稳定。信息分真假,但知识则必须是客观真实的。

4)智能

智能强调围绕知识开展的具体业务应用。在数字化活动中,如果机器可以自动地获取数据、分析数据,并使用从数据中提取的信息和知识自动进行“聪明”的决策,产生特定的业务活动行为,则它就表现出了智能的特点。智能是数字业务创新的输出成果,依托于同样的业务知识,可以设计出不同的智能化解决方案,让数据资源呈现出不同的具体数字化应用形式。

1.2.2 数字化的本质是引入经济活动秩序

前面提到,通过把数据引入业务活动所在的系统中,可以给系统注入“能量”,从而增加系统输出的确定性。对企业来讲,以这种方式可以提高经济活动的秩序。对内可以保证管理质量和生产质量,对外则可以更精准地对用户行为和市场活动进行运营和管理。在数字化业务活动中,以数据为原料,以数据分析为技术手段,有多种具体的创新业务的实现方式,具体来看主要分为3种情况:面向连接的数字化创新、面向决策的数字化创新,以及面向智能的数字化创新。

1.面向连接的数字化创新

数字化解决了业务的连接问题,包括人与人、人与物、物与物之间的连接。其底层逻辑在于,通过互联网构建事物之间互通的渠道,打破业务活动在空间和时间上的约束,拓宽业务活动的发生场景,增加业务要素组织方式的柔性,同时也改善业务主体互相协作的机制。

1)人与人的连接模式

在人与人的连接模式下,通过互联网,人的想法和行为能够以数字化的信息进行传播。线下传统业务环境中的活动被“搬到”线上,其中,基于“互联网+”的诸多商业模式的产生,就是围绕人与人之间连接的数字化创新逻辑展开的。以“互联网+”医疗为例,通过第三方网络平台,可以让患者在线进行远程就医咨询和就诊预约,获取用药建议,并在医生的指导下对自身的健康状况进行跟踪管理。互联网加强了医生和患者及患者和患者之间的广泛连接。

在传统医疗模式下,患者在有限的一段时间内,只能访问少数医院,对医生资源的选择空间很小。同时,即使只是基于主诉情况的简单问诊咨询,患者也必须在医疗场所的现场才能接受到医生正规的治疗服务。除了患者就诊时间成本较高,在医疗资源极其不均衡的偏远地区,当地患者则只能受限于附近经验匮乏的医生所提供的服务。

然而,在互联网技术提供的便捷性的基础上,患者却可以有更多的就诊选择,可以根据自身的健康状况,在更广泛的范围内筛选有价值的医疗资源,并以线上的方式远程接受医疗服务。在基于连接的数字化创新模式下,患者和医疗资源之间的分配情况可以在更灵活的条件下进行重组优化,实现有限优质医疗资源的高效利用。

“互联网+”社交也是一样,通过网络条件,改变了人与人之间产生的联系,以及彼此交友的底层规则。在传统的线下社交模式中,交友行为主要依赖于空间上关系的产生,人们更多基于空间上的邻近性产生关系;而在线上的环境中,由于空间约束被打破,人们之间的交往更多由个人兴趣驱动。除此以外,由于社交更加便捷,社交的基本属性也在发生变化。传统模式的社交活动通常需要中长期的人际关系来维系,而在线社交活动则可以突破时间维度的要求,促进即时社交、弱社交。

2)人与物的连接模式

在人与物的连接模式下,通过为物品构建数字标记的方式,让物品能够主动“发声”。以前是人找商品,购买每一件商品,人们都需要到各个商场的各个货架上慢慢探索,而当销售渠道转换为线上后,商品和服务可以实现基于购买偏好和兴趣的主动推送,也就是所谓的商品找人。

数字化的方式有效地解决了人客观的需求和商品属性之间信息不对称的问题。业务活动中的物理对象在数据域上得到统一表示,并按照特定的逻辑规则相互连接,从而显著地提升经济活动的交易效率。近两年,无论是B2C、C2C还是O2O的线上产业形态,都遵循这样的思路,其本质都是通过各种数字化的技术手段来增加人和产品及人和服务有效连接的机会。

3)物与物的连接模式

尽管当前在数字化的业务创新中,更多地围绕人的需求增加业务连接,在未来,物与物的连接更可能成为主流。通过物联网技术,可以实现终端设备与管理控制设备的连接,实现对具有生产或服务能力的智能设备终端的远程控制。

智能工厂、智能家电都是上述模式的典型应用。在智能生产车间,通过对生产任务进行规划设计,并把生产方案以BOM的形式传输到系统平台,让工业生产设备可以被远程控制。在智能家电场景,仅通过一台装有特定App的手机就能对空调、冰箱、电视、电灯等一系列家电设施进行统一操控,让其按照人们的日常生活习惯提前预置和工作。

2.面向决策的数字化创新

以数字化技术提供的连接能力为基础,融合领域应用的知识规则与经验,可以进一步推出更多面向决策的数字化创新。正如前文所述,互联网提供了连接的能力,而连接的质量,则依赖于基于数据的决策能力。

1)推荐系统

推荐算法的应用是基于决策的数字化创新的典型方式。在依托于互联网经济的诸多商业模式下,通过推荐算法,构建人与产品或服务的关联规则或关联模型,可以让产品或服务更加精准地“触达”终端消费者。这不仅能提高用户的消费体验,同时也能更有效地满足消费者的核心需求。

不同领域的推荐算法的构建逻辑是不一样的,这与领域专家的经验及推荐算法所在领域的业务模型密切相关。

在电商行业,推荐算法根据消费者的历史购买记录(数据)自动推送热门产品的购物链接;在自媒体行业,推荐算法参考用户过往对文章、视频,或笔记的浏览、点赞、分享等行为数据推送用户可能感兴趣的内容素材;在金融领域,推荐算法根据用户的交易行为和信用记录等数据对投资产品或信贷产品进行主动式营销。

推荐算法的实施落地必须依靠算法对用户和产品相关数据的深入分析,通过数据挖掘用户和产品的业务特征,并基于这些提取出来的业务特征形成“聪明”的推荐策略。

2)数据底座

为了更好地支撑业务决策,很多企业也聚焦于构建数据资源的共享能力。数据,作为一种支撑决策的重要信息资源,必须能够在有限范围内实现最大化的信息共享,让需要数据的人能够按需及时获取,充分发挥出数据的综合价值。

在前文提到的真实场景中,数据更多地表现为杂乱无章的状态。很多企业虽然拥有的数据资源很多,但是由于这些数据在不同业务场景下,由不同管理和运营部门产生和维护,于是数据在物理空间的分布十分分散。数据所处的位置不明晰,同时数据的业务含义也没有统一的标准。

在这种情况下,数据的质量不能保证前端业务的可用性。如果对数据进行有效清洗,进行统一表示,以及规范化的治理,将企业内部诸多跨业务、跨部门的数据资源进行统一的资源整合与综合管控,那么就可以保证企业中不同的前端业务部门都可以基于前端复杂的管理或运营需求,在公共的数据资源池中进行充分的业务设计与业务决策。

上述的这种基于数据共享的技术落地方案,在产业端的具体落地形式一般为企业数据中台的建设项目。数据中台是数据治理与共享的技术载体,本质上可以看作提供企业各方面决策能力的信息中心。

为了支撑企业的决策能力,光是实现数据的共享还不行,还要构建一系列的数据分析能力和数据分析结果的呈现能力。企业通过内部自建系统平台或从“云”端订阅服务的方式,可以构建起所需数据分析和数据建模的实验环境。这可以让数据分析师或数据科学家基于数据中台的资源,创造出各种形式的数据产品,例如图表形式的业务结论,或是数据模型的技术服务接口。

3)数字孪生

面向决策的数字化的第3个方面的重点应用方式在于数字孪生。数字孪生的概念与智能生产制造的概念关系较为密切,但实际上数字孪生的内涵更加广泛。数字孪生实际上就是把现实世界的物理对象通过数据感知与业务建模的方式,变成数字世界的虚拟模型,让业务对象变得可量化、可分析。在数字模型的基础上,可以进行数据分析、规律挖掘、事件预测等各种特定的计算实验。数字孪生的基本原理如图1—7所示。

图1—7 数字孪生的基本原理

数字孪生的应用场景主要是结合人工系统的运营与优化展开。例如工业产品的柔性定制化设计、生产制造车间的监控与管理调度、城市交通网络的管控与优化等。在数字孪生的思想下,数据从物理世界中来,在数字世界进行计算处理,产生的智能化解决方案再回头“反哺”物理世界的活动。

在可精准建模、可客观量化表示的复杂业务系统中,机器比人具有更强的算力优势,即对高复杂性的决策能力。这也是数字孪生“绕个大圈”去做虚拟化映射的重要意义。数字孪生的产业图谱如图1—8所示。

图1—8 数字孪生的产业图谱(来源:天风证券)

3.面向智能的数字化创新

数字化的更高级形态是面向智能的数字化创新。所谓智能,是强调机器能够代替人自动提供生产或服务的能力。面向智能的数字化创新的学科基础是人工智能技术,其中算法又是人工智能技术的核心组成部分。通过算法,机器可以根据不同的业务信息输入,产生相应的“聪明”行为。

智能的产生离不开数字化业务系统的连接能力和决策能力。智能的产生除了需要网络连接条件和计算决策能力,还需要在数字化业务中引入使业务参与对象能够自动产生活动的算法机制。这个机制要想发挥作用,就需要构建一个系统,让这个系统能够自动从外部业务环境中源源不断地获取输入信息,基于对这些信息的数据分析,自动化地产生决策行为,并指导下一轮的业务活动。

1)智能诊断

随着人们对个人健康的关注越来越强烈,面向智能的数字化创新在健康领域的应用将会变得更有前景。智能可穿戴设备可以对人的生理信号进行实时采集和监控,而将这些生理数据上传到“云”端后,通过算法分析自动地计算出人的健康状况指标,并及时给出合理的健康管理建议。

例如,通过智能手环可以监控人的日常运动情况、能量消耗情况、睡眠情况,汇总分析用户的综合生理机能,提醒用户合理安排工作与休息的均衡关系,并及时提醒用户严格执行运动计划。另外,智能心电监测背心能够实时采集用户的心电信号,对心脏进行24h全方位监控和健康评估,并对常见心脏突发问题进行预警。

2)AIoT

在一个数字化系统中,仅仅有连接能力或仅仅有决策能力都不能构成智能化的应用形态。例如,通过物联网可以把生产车间的设备与控制系统连接起来,但如果只是用网络条件来远程操控生产设备,也不能算是智能生产,而只有当在生产线上部署的信息系统可以做到根据智能算法自动地安排每个生产设备的生产任务,或者根据传感器采集的车间环境信息自动地调整设备运作的工作参数,才能称为有智能化特点的生产能力。

对智能家电场景来讲,家电的智能化水平重点不是在于可用移动设备接入网络对其进行远程遥控,而是可以根据人的自然语言指令,或者对环境的感知,通过底层算法自动分析判断其应该产生什么工作行为。例如,可以直接与智能音箱进行对话,用日常交流的语言告诉智能管家打开电视的需求,此时智能音箱中的语音识别系统就会自动将自然语言指令翻译成“打开”遥控指令并执行。再如,通过声控传感器可以自动地感知到房间里“没人”的状态,从而使正在工作的空调、电灯等家电自动关闭,达到节能减排的效果,同时避免可能发生的用电安全隐患。

智能驾驶可以说是面向智能的最热门数字化创新。智能驾驶的实现依赖于大量传感器的应用和底层的智能控制系统,通过激光雷达、陀螺仪、GPS导航等传感器,智能驾驶系统可以获得环境信息、空间定位信息。通过将这些信息输入底层的算法模型,自动地决定如何实时根据路况动态地调整行驶方向、行驶速度,以及行驶路线,让车辆达到无人驾驶的“智能”效果。

相比于整个社会的产业经济图景来讲,现在真正能比较好地代替人的可靠智能化应用场景还不算很多,但随着人工智能技术在算法发展上越来越成熟,以及这些算法性能所依赖的大数据的可获得性越来越强,面向智能的数字化应用也将会越来越有发展前景。 +VrObzNZZQUFObCkzfy6kpvREjoSDo/KMV89+Lyfjjf5999hv28PWqKicq+t1KwW

点击中间区域
呼出菜单
上一章
目录
下一章
×