将数据进行标签化的思路就像微积分。微积分是两个概念的组合,先微分,再积分。微分是把一个大的东西切分成足够微小的部分;积分是把切分后的微小部分组织合成。标签的设计过程就是把各种对象充分“微分”的过程,解析和拆分得足够精细;而标签的使用过程就是将场景中涉及的对象标签拼装在一起使用,是一个“积分”的过程。
通过微积分的比喻,我们可以更好地理解“传统数据处理过程”和“标签化数据处理过程”的显著差异。
传统的数据处理往往是业务到数据再回到业务的快速贯通。
将业务端新鲜产生的源数据传到数据工厂中进行清洗处理,再快速将生产好的数据直接透传到业务端进行使用分析(见图1)。整条链路就像生产流水线一样快速、简洁、干脆。但是在同一份数据的跨业务领域使用或跨时间先后使用的场景中,经常存在复用困难的问题。
图1 传统数据处理过程
标签化的数据处理则意味着数据需要经过标准化组织后规模复用。
源数据经过清洗、加工、处理后,并不能直接搭载飞机直达业务现场,而是全部规规矩矩地到数据资产仓库的格子间验明正身、对号入座(见图2)。业务端要使用数据,必须拿着提货单到资产仓库一一挑选,检验后的标签资产会像搭载高铁般准时到达业务现场。这种模式很明显,由于增加了中间数据资产的管理环节,整体建设花费的时间较长,即“砍柴”前需要等待较长的“磨刀工”。
图2 标签化数据处理过程
前一种适用于小企业对所需的数据服务产出时效有严格限制,只关注当前某一个局部的应用场景。实际上当前在很多大型集团企业中,快速完成数据开发后直接插管子、将数据灌送至业务系统的情况很普遍。
后一种实际上已经是一种中台模式了:将生产好的数据全部入库编号,并检查标签项是否完整、规范、准确。业务人员无论在何时选用资产都可以根据充分公开的标签信息自由下单,标签之间可以自由组合。这种将经常用到的信息、技术、功能进行标准化封装以供业务端不同场景复用、拼装的做法就是中台模式。中台模式适用于业务场景多样化的大型集团企业:通过一次建设、反复享用的方式可以节省成本,形成规模效益,同时还可以为企业沉淀核心的数据资产。
在实施落地数字化转型的过程中,企业会遇到理念与实际冲突的情况,也会遇到各种阻力和困惑。到底选择传统数据模式还是标签化数据模式,本质而言是效率问题和商业问题,也许“慢就是快”的长线思维和“成本降低,收入增加”的财务公式能让大家聚焦问题本质。
因此对数据资产的认知决定了一家企业从上到下会如何看待、选择数字化转型的路径。是先解决眼前问题、渡过难关,还是延迟满足,不能马上见成效的事也做?是选择赢得一时一刻绩效达标的有限游戏,还是选择不断满足用户需求、基业长青的无限游戏?
希望这本书能给大家带来思考和答案。
数澜大学
2021年5月