隐私计算:推进数据“可用不可见”的关键技术
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

➢ 联邦学习被正式提出

联邦学习这一术语由谷歌科学家McMahan等人在2016年首次提出。事实上,对于数据隐私保护的分布式机器学习的研究,早在2013年左右即有学者发表了相关成果,谷歌团队也是自2014年就开始了To C场景的相关研究,但直到3年后取得一定成果时才将其公开发表。也正是由谷歌提出的这一概念,才使得联邦学习在大数据与人工智能领域开始得到大量关注。概念提出之时,在大量通信带宽有限的不可靠设备上对不平衡和非独立同分布数据执行分割,被认为是联邦学习面临的核心挑战。

此后,微众银行等国内企业从金融行业实践出发,提出“联邦迁移学习”的解决方案,将迁移学习和联邦学习结合起来。目前在人工智能领域,各类开源的联邦学习框架如FATE、TensorFlow Federated持续涌现并趋于成熟。

经历了前期长时间的理论积累,隐私计算自2018年开始快速向实践落地发展,技术和产品成熟度迅速提升,国内外隐私计算产业化的步伐明显加快,互联网巨头、电信运营商和大数据公司纷纷布局,大批技术研发的初创企业相继涌现。如图1-6所示,2018下半年到2021年上半年间国内发布的隐私计算产品数量持续快速增长,越来越多的技术提供者加入竞争赛道。在中国信息通信研究院“2020大数据‘星河’案例”评选中,共有25个标杆和优秀的隐私计算应用案例入选,场景覆盖金融风控、保险评估、精准营销、医学病毒基因研究等多个领域,可以预见,未来几年将是技术产品加速迭代,应用场景快速升级,产业生态逐步成熟的重要阶段。

图1-6 国内隐私计算产品数量增长迅速

本书接下来将会从技术、应用、产业、法律等维度对隐私计算的发展进行更加详细的介绍。