人工智能自1956年在达特茅斯会议上被正式提出以来,经历了三轮发展浪潮。第三轮浪潮起源于深度学习技术,并实现了飞跃。人工智能技术不断发展,在不同前沿领域体现出强大活力。然而,现阶段人工智能技术的发展受到数据的限制。不同的机构、组织、企业拥有不同量级和异构的数据,这些数据难以整合,形成了一座座数据孤岛。当前以深度学习为核心的人工智能技术,囿于数据缺乏,无法在智慧零售、智慧金融、智慧医疗、智慧城市、智慧工业等更多生产生活领域大展拳脚。
大数据时代,公众对于数据隐私更为敏感。为了加强数据监管和隐私保护,确保个人数据作为新型资产类别的法律效力,欧盟于2018年推行《通用数据保护条例》(GDPR)。中国也在不断完善相关法律法规以规范数据的使用,例如,2017年实施《中华人民共和国网络安全法》和《中华人民共和国民法总则》,2019年推出《互联网个人信息安全保护指南》,2020年推出《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》《中华人民共和国个人信息保护法(草案)》等。这些法律条目都表明,数据拥有者需要接受监管,具有保护数据的义务,不得泄露数据。
目前,一方面,数据孤岛和隐私问题的出现,使传统人工智能技术发展受限,大数据处理方法遭遇瓶颈;而另一方面,各机构、企业、组织所拥有的海量数据又有极大的潜在应用价值。于是,如何在满足数据隐私、安全和监管要求的前提下,利用多方异构数据进一步学习以推动人工智能的发展与落地,成为亟待解决的问题。保护隐私和数据安全的联邦学习技术应运而生。