在前文中,我们介绍了MLOps的概念及相关角色。相较于传统的软件项目,机器学习项目从问题定义到投产持续服务,除了代码逻辑复杂度提高之外,模型的复杂度也提高了,涉及数据、算法、开发、运维等多个领域,需要不同专业背景的角色共同参与,挑战更大。更进一步,随着机器学习算法的不断成熟、场景不断增多,降低落地门槛、提高规模化落地效率都迫切需要方法论和工具链的支撑。
在这样的大背景下,MLOps作为一个新兴领域正在蓬勃发展。MLOps的作用是围绕机器学习项目生命周期,帮助各个角色在一致的方法论和工具链支撑下规范、协同工作,通过自动化工具和集成平台简化工作,消除不必要的错误,加速机器学习项目的规模化落地。
为了更好地学习和理解后续章节,本章将重点介绍机器学习涉及的相关概念和问题,并从全局视角解读机器学习项目的全流程,探讨在机器学习项目全流程中MLOps需要解决的痛点。