目前主流的隐私计算技术路径包含可信执行环境(TEE)、多方安全计算(MPC)与联邦学习(FL)三大方向,同时结合零知识证明、同态加密、差分隐私、区块链等技术在多个实用景落地应用。
硬件层面:可信执行环境
TEE主要应用于金融行业,银联自2012年起就开始与多方产业链合作制定包括TEE硬件、操作系统、基础服务和应用等各个层面的规范标准,并且于2015年通过审核发布银联TEEI规范。
2017年初,人民银行开始制定TEE各层面的需求类规范。2020年7月,中国信通院发布联合20家单位共同参与制定的标准《基于可信执行环境的数据计算平台 技术要求与测试方法》。
数据交互层面:安全多方计算
姚期智先生提出的百万富翁问题引发了全世界密码学专家的思考,在提出该问题四年后,混淆电路的出现解决了这个问题,随后开启了安全多方计算的研究热潮。
现如今基于秘密共享等方式提出了BMR、GMW、BGW、SPDZ等安全多方计算框架,实现了多方联合数据分析、数据安全查询等场景使用。
数据建模层面:联邦学习
联邦学习在国内是从2018年开始兴起,经过两年多的迅猛发展,2020年隐私计算平台和产品迎来爆发,通过评测的联邦学习产品多达18款。
且从“隐私计算联盟”的成员单位来看,拥有联邦学习平台和产品的企业已经超过60多家,既包括头部互联网公司,也有初创公司。
随着我国隐私计算行业的发展,隐私计算行业出现了许多成功的创新应用案例,在跨行业、跨机构之间搭建了隐私计算平台,帮助实现数据使用权变现和数据要素创新。
虽然我国隐私计算企业在2017年时便开始兴起,但直到2019年到2020年才正式进入市场启蒙阶段。
在这个阶段,国内BAT等头部互联网公司纷纷入局,可以说是重兵囤积、大张旗鼓,国内大部分隐私计算创业公司都是在这一时期成立的。
根据隐私计算产业研究报告所述,我国隐私计算在市场启蒙阶段基本形成以下三大阵营:
以蚂蚁、腾讯、百度、字节等为代表的互联网巨头企业;
以阿里云、金山云、华为云、优刻得等为代表的云服务商;
第四范式、星环科技、瑞莱智慧、华控清交、医渡云等科技和AI公司。
虽然隐私计算企业发展至今只有5年的时间,但是我国隐私计算技术与落地应用发展迅速。而这几大阵营的厂商又是如何布局隐私计算的?又将会对隐私计算应用落地起到哪些作用?
基于数据隐私的重要性,各大互联网巨头都开始加大对隐私计算的投入,鉴于数据隐私的法律法规越来越严格的情况,数据跨域传输安全性要求只会越来越严格。
所以为了确保在未来的赛道中脱颖而出,并且保持领先优势,包括字节、阿里在内的互联网大厂等开始纷纷布局隐私计算技术。
2020年,京东与字节跳动在营销领域进行联邦学习合作,成功实现联邦学习平台的落地,并且基于业务进行联邦建模,双方业务大涨,效果显著。
2021年,蚂蚁隐私计算平台“隐语”在医保DRGs建模中进行应用实践,如今看到阿里安全部门在USENIX Security Symposium 2022大会上发表关于高性能两方安全计算的框架应该算是结出了丰硕的果实(在隐私计算领域,阿里是唯一在USENIX Sec22上发表论文的中国公司)。
阿里达摩院发布了2022十大科技趋势,全域隐私计算强势上榜,并且阿里云、阿里妈妈与蚂蚁等都投入重兵布局隐私计算。
百度研究院发布了2022年的十大科技趋势预测,隐私计算技术备受关注,将成为数据价值释放的突破口和构建信任的基础设施。
目前,阿里已将“猎豹”两方安全计算框架贡献到蚂蚁的隐私计算框架“隐语”中,加速行业互联互通,确保数据流通过程的安全合法合规。
从整个政策层面与行业巨头的布局方面,可以清晰地看出隐私计算行业未来的重要性,未来一片光明,我们期待早日看到国产平台早日建成属于自己的科技壁垒和护城河。
云服务商具有大数据、人工智能等技术,这些技术与隐私计算的发展非常契合,加上云平台建立基础是具有确保数据安全流通的底层能力,因此不管是从技术衔接还是实际需求,云服务商做隐私计算具有天然的优势。
拿阿里云举例,去年阿里云数据中台推出隐私增强计算产品DataTrust。
这是一款保证企业数据安全流通的产品,提供多方数据联合分析、联合训练、联合预测等功能,在数据多方间构建有效信任体系,解决了跨组织、跨机构间的数据安全信任问题。
DataTrust基于阿里云底层多项基础安全能力,融合了阿里云数据中台丰富的客户业务实践,通过数据可用不可见技术,实现产业间高效协同,帮助行业、机构实现数据价值的共享与协作。
作为全球前三、国内第一的云厂商,阿里云在世界各地均有海量的计算资源与高速可达的网络,云的多可用区与多地域布局,让数据得以就近上传,而隐私计算则保证了数据流通过程中的加密性和安全性,也免去了客户代理机配置等繁琐操作。
除了阿里云外,UCloud优刻得也算是隐私计算领域早期的云服务商探索者之一。
早在2017年,UCloud优刻得参加国家重点研发计划“云计算和大数据”专项——“软件定义的云际计算基础理论和方法”项目,首个推出数据安全流通平台——安全屋,创新提出数据“使用权”和“所有权”分离的理念,确保数据在流通过程中“可用不可见”、“可用不可得”。
而2021年,UCloud优刻得升级安全屋,形成可信数据沙箱、安全多方计算、联邦学习等三大数据安全流通平台。推出至今,“安全屋”已广泛应用于政府、金融、医疗等领域,是目前行业应用范围最广的一款数据安全流通解决方案。
近日,包括UCloud优刻得在内的多家隐私计算联盟成员共同参与编写的《隐私计算应用研究报告(2022)》、《可信隐私计算研究报告》在2022隐私计算大会上重磅发布。
相信未来几年,云平台一直会是隐私计算技术产品加速迭代的重要舞台,其应用场景也将快速升级、产业生态逐步成熟。而云服务商也将是这个舞台上的重要参与者,探索让数据价值得以安全流通的更多可能性。
在过去的十几年时间里,隐私计算算法得到了长足的进步,其中联邦学习算得上是发展最快、落地性最强的一个分支,而它的重要应用便是AI机器学习。
近年来,数据被全球各国列为核心资产,但因无法共享数据而形成一个个数据孤岛,阻碍了AI落地。
而隐私计算的出现为AI领域开辟了可行的应用可能性,随之出现了华控清交、星环科技、瑞莱智慧、翼方健数等布局隐私计算的科技或AI公司。
以华控清交为例,2018年6月,华控清交成立。短短四年时间,华控清交于今年完成近7亿元的B轮融资,估值达45亿元,投资方囊括联想创投、中关村科学城、华兴资本、OPPO集团等知名机构。
除此之外,华控清交还参与了北京国际大数据交易所以及湖南大数据交易所的建立。此前,由光大银行和华控清交联合建设的行业内首个隐私计算金融基础设施已落地,公司还在电力、通讯、制药等行业进行探索。
而华控清交的大规模集群系统的可扩展性已经实现突破,能够将一万亿数据纯密文逻辑回归训练耗时降低到小时级,为大规模的隐私计算提供技术支撑。
为降低单个节点能耗,华控清交还通过自主研发的半同态DSA(特定领域的芯片架构)和芯片,单节点性能实现了每秒达到数十万行的隐匿查询速度,相当于上千个CPU核的算力。
而翼方健数虽然是一家以隐私计算和人工智能为主要研究方向的年轻公司,却已是隐私计算领域的“老兵”。
早在2016年成立时,翼方健数便扎入研究隐私计算的开发与应用,目前其业务已从医疗拓展至政务、金融、营销、科学等领域。
2019年初,翼方健数发布数据医疗隐私计算平台XDP翼数坊,旗下系列产品PathFinder、Pioneer、Percepter主要着力于解决智慧医疗生态下的各类现存问题。
此外,翼方健数一直认为开源对隐私计算意义重大。今年7月,翼方健数推出隐私安全计算开源技术——翼数开源,包括翼数联邦学习框架及翼数安全计算框架。在这两个框架开源的引领下,翼方健数仍在计划逐步开源其他自研技术栈。
为了让更多数据实现流通产生价值,开源正是理想的分享与推广方式,有利于扩大隐私计算的整体市场规模。
通过开源降低隐私计算的门槛,让隐私计算赋能更多的数据和应用,助力技术创新,加速促进数据与计算互联网的建立,也能持续推动AI人工智能领域的健康发展和应用落地。
虽然发展至今,隐私计算仍然是一项处于发展早期的技术,各方面还有着较大的优化空间,但我们正在见证,在市场启蒙阶段,各行各业愈发重视隐私计算的价值,开始布局并推动技术应用,创业公司一时间如春笋般涌现,投资人更是一掷千金。
其实,这不仅源于政策立法监管趋严迫使数据应用催生出隐私计算的大量需求,更因为人们隐私意识增强,让企业面临更多的用户响应场景。
数据作为生产要素,具有巨大的发展潜力,而随着万物互联的大数据时代到来,还会有更多数据产生。
根据中国信通院调研数据显示,2021年约有44%的隐私安全计算产品进入实施阶段,占比进一步提升;处于研发阶段的隐私安全计算产品占比相对下降,占比为19%。
可以看出,随着对隐私计算落地需求的不断提高,市场探索阶段的初步成果正在人们眼前慢慢呈现。
虽然我们不能确定隐私计算究竟何时才能实现普及应用,隐私计算的分支技术又会是如何发展,但笔者相信,这场隐私计算赛道风口必然不会一家独大,而是呈现出各行各业互联互通的发展局面,最大限度发挥出隐私计算的技术优势。
本文为论道隐私计算团队原创,未经允许严禁转载,如需转载请联系我们。
来源:金色财经