购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.1 国内外IT运维现状分析

国内外的运维有相似之处,但也呈现出一些不同的特点。接下来将从运维技术、运维服务、运维组织三个维度对国内外的运维现状进行分析。

1.1.1 国外IT运维现状分析

相对而言,国外IT运维管理的理念、方法和技术框架较为先进和体系化,体现在技术工具、管理体系和运维组织等各方面。

1.运维技术维度

在运维技术方面,基于Gartner的《2021基础架构运维管理自动化技术曲线报告》,以管窥豹,进行国外IT运维现状的分析和解读。

1)已经进入实质生产的高峰期的技术:这个时期的技术包括ITIL(Information Technology Infrastructure Library,信息技术基础架构库)、云应用发现、云迁移和云管平台等。

2)正处于稳步爬升的光明期的技术:这个时期的技术包括持续配置自动化、DevSecOps、基础架构管理服务的信息安全、SOAP等。

3)正处于泡沫化的低谷期或者正向低谷期演进的技术:这个时期的技术包括软件资产管理工具、基于意图的网络、不可变基础设施、DevOps(Development & Operations)工具链、网络自动化、超级自动化、可组合的基础架构、持续交付、容器管理、I&O智能自动化、云数据备份等。

4)正处于过高期望的峰值的技术:这个时期的技术包括SRE(Site Reliability Engineering,站点可靠性工程)、基础架构自动化、可观测性、SaaS管理平台、可编程的基础架构、智能运维(Artificial Intelligence for IT Operations,AIOps)平台等。

5)正处于诞生的促动期的技术:这个时期的技术包括平台化运营、持续合规自动化、混沌工程、混合数字化基础设施管理、DevOps服务价值交付平台、DevOps服务价值管理平台、智能化ITSM(Information Technology Service Management,信息技术服务管理)、代码即策略的GitOps等。

对这些技术进行分析发现,国外IT运维呈现明显的三大阶段:

❑以ITIL为指导的IT服务体系和以云管系统为云操作的运维管理体系已经成熟。

❑以自动化运维为目标的各类自动化运维系统和工具已逐步趋向成熟。

❑以数字化和智能化为导向的运维管理和运维方式依然处于上升期。

对于已经成熟的技术,我们可以大胆采用,小心落地;对于正在成熟的技术,则要仔细辨别,选择性落地;而对于处于上升期的技术,最好继续观望,试点性探索。

2.运维服务维度

在运维服务维度,国外的运维服务标准已经进化到ITIL 4阶段,强调以运维价值为中心的敏捷ITSM体系建设。针对敏捷ITSM建设理念,国外的知名厂商虽然理解各有不同,但大体相似。全球排名第一的ITSM厂商ServiceNow对敏捷ITSM的主要理解如下:

1)统一平台与内容整合:实现多来源的流程、数据、基础设施和工作流等的整合,打破竖井。整合之后,对于用户而言,一个运维平台即可搞定所有运维工具。

2)整体能见度:需要实现运维服务的整体能见度高,以及基于数据的决策。

3)敏捷与快速:快速响应业务的变化;通过调整从维护到创新的预算来提高生产力。

4)协作与沟通:全方位、实时地协作与沟通。

5)用户体验:员工体验的消费化与满意度。

6)数字化运营报告:需要实现信息技术管理方式的现代化,以及体现服务管理绩效透明度的报告。

7)IT与企业服务整合:能够实现向用户提供全方位的服务,以及ITSM和ESM(Enterprise Service Management,企业服务管理)的整合。

总体而言,当前国外的运维服务理念强调以稳定的业务系统运行保障和良好的用户体验支撑为价值导向,通过ITSM与ITOM(Information Technology Operation Management,信息技术运营管理)的融合,实现服务管理实践场景、运维数据和运维执行的融合,从而实现外部用户服务请求和业务系统状况响应的敏捷性。

3.运维组织维度

国外的运维组织形式多样,包括敏捷运维组织、SRE运维组织和传统职能运维组织等。当前很多企业从传统职能运维组织向敏捷运维组织和SRE运维组织转变。例如荷兰ING银行从传统职能运维组织往敏捷运维组织转型,Google公司则选择往SRE运维组织形态发展。

传统金融机构荷兰ING银行于2015年6月首次在总部引入敏捷的工作方式,并在一年后将其扩展到极少运用敏捷方法的IT基础设施和运营领域。这一举措不仅让银行IT运营更快速、更稳定,也大大提升了工作效率和员工参与度。

知名互联网公司Google是SRE的提出者和践行者。Google公司通过组建SRE团队,实现工程化的、高效的运维服务。但是,依然有大量的公司使用传统的职能式组织模式来进行日常的运维服务。

1.1.2 国内IT运维现状分析

国内IT运维受到国外IT发展的影响,同时又受本土环境与条件的制约,在运维技术、运维服务、运维组织等维度与国外既有相似之处,又有所不同。

1.运维技术维度

与国外IT运维形势类似,国内的IT运维也正在发生巨大的变化。这里以国内著名科技媒体InfoQ所发布的《InfoQ 2022年趋势报告》为例来解读国内IT运维现状。

1)已经完全成熟的晚期大众技术:这个时期的技术主要以ITIL、ITOM工具、ITOA(Information Technology Operation Analysis,信息技术运营分析)工具和应用运维工具为主。事实上,这些传统技术如各类监控工具、ITSM流程工具、应用维护产品、虚拟化运维工具、其他传统厂商的运维和展示工具等都已被应用多年,支撑传统的物理机、虚拟化环境已经绰绰有余,主要用于支撑传统非云环境的集中式架构应用。

2)尚未完全成熟的早期大众技术:这个时期的技术包括3类:资源运维类工具、DevOps类工具、自动化运维类工具。资源运维类工具包括基础设施运维工具、Kubernetes、Docker等,主要用于解决新型的面向DevOps的基础资源统一运维服务的问题;DevOps类工具包括CI/CD工具、DevOps工具,主要用于解决敏捷交付中开发流水线以及开发与运维协同相关的问题;自动化运维类工具用于解决云平台与分布式环境下,海量应用服务监控以及海量基础资源的批量操作问题。

3)处于探索阶段的早期技术:这个时期的技术包括应用的架构及管理模式、运维的组织模式以及运维的技术手段3种类型。应用的架构主要以Service Mesh(服务网格)为代表。总体而言,处于非成熟性技术都未经过大规模落地和实践的检验,需审慎选择。

综上,我们发现,整体上国内的运维技术包含研发、运维、运营全生命周期,与国外比较类似:ITIL和传统厂商的ITOM工具日渐成熟,各类新型的资源管理和自动化技术蓬勃发展,而以AIOps为代表的前沿技术被越来越广泛地探索和实验。

2.运维服务维度

在运维服务维度,无论是理念还是产品落地,国内企业都稍显落后。下面围绕互联网公司、大型传统企业、其他传统企业3种类型进行分析。

对互联网公司而言,运维效率优先,同时兼顾管控,所以近年来逐步借鉴ITIL理念,通过自研的方式构建了符合自身情况的IT流程管理。此类IT流程管理工具往往能够与CMDB(Configuration Management Database,配置管理数据库)、自动化工具、监控工具等进行较好地融合,实现流程管理的自动化。

大型传统企业如国内四大银行中的某大型银行,ITIL理念依然以ITIL v3为主,更加注重运维过程审批、管控、记录、合规及审计,对运维效能的关注和实践不足。在企业自动化运维水平逐步提升之后,大型企业已经意识到纯管控式运维服务对整体运维转型和效能提升的桎梏,已经在逐步解决此问题。

其他传统企业在运维服务维度的建设情况各有不同。部分中大型企业仅关注如事件、故障、变更等重点流程,且也以管控为主;大部分中型企业使用简单的运维工单;一些小规模企业可能在企业办公系统OA上运行相关流程。

总之,国内企业在运维服务层面相比国外企业还有很大差距。传统行业的头部企业的运维服务建设以流程式管控为主,很少能兼顾运维效能和运维敏捷性;而更多的中大型企业、中型企业尚未建立标准化的运维服务模式,敏捷式管理更无从谈起。头部互联网公司在运维服务维度也仅走到了流程自动化阶段,距离融合式、敏捷化流程管理还相当远。

3.运维组织维度

在运维组织维度,国内企业与国外企业也有很大不同。对于大型互联网公司,例如腾讯IEG事业群,运维组织主要采用平台式技术运营的模式。这种模式的优点是运维团队解耦分层,各自专注于自身的工作,且日常工作中不需要紧密协作。其他互联网公司也基本采用类似的组织模式。具体而言,团队组织包括如下几种(图1-1)。

1)运维支撑平台团队:负责运维中台的建设和通用运维能力的输出,例如资源管控能力、作业编排能力等;负责平台能力的迭代与升级,以不断满足各个运维小组对运维底座能力的要求。

图1-1 互联网企业典型运维组织架构图

2)应用运维团队:负责业务和应用系统的全生命周期的运维支撑与管理;基于运维平台,开发通用的或者个性化的运维场景工具,支撑自身应用的运维。

3)基础设施资源管理团队:负责包括物理机、云主机等各类资源的调度与供给。

4)安全管理团队:主要负责运维过程中的事前安全标准制定、事中安全审核以及事后安全审计。

5)运维指导组:主要负责整体运维规范、标准、组织、岗位、人员能力等的规划与考核。

对于传统大型企业而言,例如大型银行单位,其运维组织往往是金字塔形的职能式架构。这种架构的优点是结构简单、构建自然、管理方便,同时每个团队在专业职能上可以深度发展。缺点也很明显:当业务系统的运维支撑越来越强调端到端的自动化和敏捷时,职能模式形成的部门墙会成为很大的阻碍。

其他非互联网行业的中大型企业基本采用类似的职能式架构,只不过根据运维人员数量进行了相应精简和调整。

数字化时代,企业的所有业务模式和运营过程都离不开IT系统的支撑,而IT系统的背后则是运维管理体系的数字化管理和敏捷管理。数字化转型不仅影响企业的业务战略和业务运营,还直接影响企业的研发运维服务模式。数字化转型的要义在于端到端的、全方位的、立体的“连接+数据+智能”,一方面需要企业更新和新建更多业务系统,实现基本的数字化支撑,另一方面需要企业更加敏捷地识别、捕获和响应市场端的需求,推陈出新,更好地服务客户。这两方面都需要数字化和敏捷的研发运维服务模式的支撑,否则企业的业务敏捷和模式创新就会成为空中楼阁。

企业数字化转型需要企业运维服务的数字化转型,运维数字化转型会进一步优化IT管理,提升对业务响应的敏捷性,更好地服务于业务。运维服务的数字化转型是企业数字化转型的一部分,需要有系统的指导思想和方法体系。 m8y4foTYPzmuoJwNk0IxD2lbzDlAdhspIjiSB0E1dkWPQq15A1aape3pkXD354tA

点击中间区域
呼出菜单
上一章
目录
下一章
×