数据是新时代的驱动引擎。在人工智能越来越重要的今天,是否拥有海量数据关乎成败。因为数据是由不同机构、企业、部门产生并拥有的,所以汇集数据至高性能数据中心进行处理、建模,是传统的行之有效的方法。然而,这种方法将不再适用。
随着社会的发展,用户隐私和数据安全的关注度正不断提高。从个人层面上来看,数据拥有者极力反对无限制计算和使用敏感数据,隐私信息未经许可便被商业机构利用被视为违规。从法律层面上来看,法律制定者和监管机构拟出台新的法律来约束数据的使用。在这样的环境下,不同机构间的数据分析会越来越困难。
联邦学习正是解决这些挑战的关键技术之一。在过去的几年里,不论是在研究领域,还是在产业领域,尤其在金融科技领域,我们都见证了联邦学习从无到有、由面对质疑到逐步崭露头角的历程。联邦学习基于同态加密等方法来保证本地训练数据不公开,在此前提下,同步实现多个数据拥有者协同训练一个共享的机器学习模型。基于不同的应用场景,联邦学习逐步发展出了横向联邦学习、纵向联邦学习、联邦迁移学习等类型。
作为金融控股集团的成员,光大科技有限公司在融会贯通联邦学习原理、算法、平台框架的基础上,聚焦机构业务、产融协同,对联邦学习的落地应用展开探索。本书为团队探索经验与知识的结晶,希望以金融科技为突破口,以实践推广为目标,以创新发展为初心,为联邦学习应用于产业贡献绵薄之力。
本书共10章,内容丰富,围绕联邦学习在金融科技领域的落地应用展开论述,循序渐进,由浅入深,涵盖范围包括背景历程、算法模型、平台框架、应用实战,还包括联邦学习与数据要素流通、自然语言处理等新兴领域结合的思考与展望。本书可以作为计算机科学、人工智能和机器学习专业学生的入门参考书,也可供大数据、人工智能、金融科技领域的应用程序开发人员和数据挖掘人员,甚至研究机构的研究人员阅读,提供了新的思路和视角。
向小佳
光大科技有限公司副总经理