• NFT:本站分享NFT相关资讯,资讯仅代表作者观点与平台立场无关,仅供参考。
Image

隐私计算软硬件结合起跑

  • 零壹财经
  • 2022年10月07日09时


来源 | 零壹财经

作者 |温泉、姚丽


隐私计算市场的采购风向正在悄然发生变化。


2021年,隐私计算成为大热的赛道,不少金融机构纷纷尝试招标采购隐私计算软件系统。但是现在,已经开始有金融机构也考虑采购相关硬件。


高声谈(化名)所在的国有大型保险公司就是其中之一。高声谈告诉零壹财经,现在该公司在重点考虑的一个问题就是,要不要采购可信计算与隐私计算结合的产品,这就要涉及到硬件。


有这样考虑的不只高声谈所在的公司。据零壹财经了解,还有更多的大型金融机构也在关注相关问题。交通银行金融科技创新研究院高级创新研究员王光中向零壹财经表示,有的业务并发以及数据量要求不高,现有的一些软件产品已经能覆盖需求,目前也看到了一些金融机构的落地应用案例。对于海量数据的高性能实时计算,对算力要求高,软硬件结合则会是一个趋势。


而从提供隐私计算产品的厂商来看,就在一年前,隐私计算软硬件结合还是一个寂寞的赛道。据零壹财经了解,在这个赛道上,当时除了产品线丰富、有战略储备的蚂蚁集团之外,仅有两家初创公司——以提升隐私计算算力见长的星云Clustar和苦苦研发隐私保护芯片的融数联智。


但是现在,情况正在发生变化。


“不完美”的软件



2021年,高声谈开始密切关注隐私计算领域,展开了与这个领域头部公司的广泛交流和产品测试。

随着了解的深入,他越来越发现,如果仅仅采购隐私计算软件系统,可能是不够的。“在考虑实用性的前提下,基本上所有隐私计算产品均无法应对恶意攻击。”他得出结论,这也是让他极为担心的一点。对采购负责人来讲,相关问题引发的采购风险不容忽视。

在摸索中,高声谈发现问题的解决方式可能是可信计算与隐私计算的结合。目前,可信计算的技术思路是通过在硬件平台上引入可信平台模块(通过可信计算组织标准的安全芯片)来提高计算机系统的安全性。

经过一番研究,高声谈认为,可信计算致力于解决网络攻击,尤其对恶意攻击有明显防护效果;隐私计算主要为解决个人信息保护,解决个人信息数据在传输过程中的匿名化和去标识化问题。可信计算对恶性攻击的有效防护可以极大减轻隐私计算的安全性压力,两者的有机结合可能将是行业的发展方向。

安全性问题,是隐私计算在实际商业应用中遭遇的两个最主要的问题之一。另外一个问题是性能的问题,就是运行起来太慢。

这种慢,在计算机单机、单机和单机之间、计算机集群之间这三个层面上都存在。

在计算机单机上,隐私计算由于运用了密码学技术,计算过程中涉及到很多加密解密的步骤,这使得计算量以几何级数增加。以全同态算法为例,在通用芯片上密文运算的速度比明文运算慢了10万倍。这意味着,做同样的运算,如果用全同态算法,在Intel最新的Icelake处理器上,跑出来的效果等同于Intel的第一代8086处理器,直接回退了数十年。这使得同态加密在现实情况下就不具备可用性了。算力问题也是导致全同态算法一直未得到广泛应用的根本原因。

在单机之间和计算机集群之间,会涉及到单机之间和集群之间的通信效率问题。一方面,主流的隐私计算技术无论是联邦学习还是多方安全计算,都有通信问题。密文膨胀、传输次数膨胀,会导致单机之间网络传输效率成为隐私计算的瓶颈之一。另一方面,由于大多数隐私计算的场景都是跨多方的,多方要通过公网进行通信,公网的带宽与时延目前也是巨大的鸿沟。

性能的问题,会随着时间的推移越来越严重。2021年,隐私计算的落地尚处于颇为早期的阶段,主要是在一些机构内部或者是两方、三方之间应用,处理的数据量较小,这个问题还不明显。可是未来,多方数据交换需求的到来、5G和物联网的发展所带来的数据量急剧增大,最终导致的将是数据量爆发式的增长,这需要消耗大量的算力。到那时,隐私计算的性能将面临巨大的挑战。

但是,这并不意味着性能问题还很遥远,恰恰相反,它近在眼前。要解决隐私计算的算力问题,需要调用大量的服务器,这意味着即将攀升的巨大成本。“算力就是金钱。”一位业内资深人士直言。

蚂蚁破题软硬结合



蚂蚁集团可信原生技术部是业界最早开始研究如何解决上述问题的团队之一,也是零壹财经在调研中发现的对该问题的解决方案最成体系的团队。

对可信问题的解决,现在已经成为蚂蚁集团技术发展的核心方向之一。支付宝成立于2004年,此后15年间的技术发展主要是解决功能性和可用性的问题。但当支付宝成为国民级应用,解决了大部分功能可用性的问题以后,就要解决可靠性的问题,不能出现服务的不稳定。着眼未来,可靠性问题的解决涉及到数据,而数据的核心问题是隐私保护问题、系统是否足够安全的问题。因此,在可用、可靠的基础上,支付宝也需要解决可信的问题,这也是下一代金融基础设施必须解决的问题。

为此,蚂蚁集团可信原生技术部组建于2018年,逐渐发展的关键技术包括云原生、安全容器、机密计算、可信硬件、小程序运行时等底层硬核技术。从硬件的芯片设计到运维管控系统,计算机底层技术栈都有涉及,是蚂蚁技术体系中底层中的底层。同时,几乎蚂蚁所有的业务线都是其客户,所有部门对其技术都会有所要求。

2021年下半年,通过与蚂蚁链摩斯团队的交流,蚂蚁集团可信原生技术总监秦承刚发现,软硬件结合可以帮助摩斯团队很好地提升隐私计算产品的能力。在这方面,蚂蚁集团可信原生技术部有成功经验。2020年,蚂蚁集团曾经发布过数据库一体机和区块链一体机,这两款产品都是采用软硬件结合提高了产品的安全性和性能,受到了市场的欢迎。

对安全性的提升,秦承刚告诉零壹财经,蚂蚁的思路是保障数据全生命周期的安全。隐私计算主要是解决数据在计算过程中不泄露的问题,这仅是数据安全的其中一个环节。数据从产生到计算再到消亡,会涉及采集、传输、存储、计算、销毁等多个环节,其生命周期可能会有数十年之久,要真正保障数据安全需要一个更加全方位的、体系化的解决方案,以使得每个环节上都有对应的技术体系保障数据安全。

而这些技术,前几年蚂蚁集团在建设内部数据中心的时候都已经趟过一遍,积累了丰富的经验。秦承刚介绍,在数据采集阶段需要精心设计设备可信架构,在网络传输阶段需要合理运用安全协议,在存储阶段需要兼顾加密与性能,在数据计算阶段需要灵活选择可信执行环境与密态运算。除此以外,计算环境的可信与安全在防御纵深建设上也至关重要。这些安全保障能力的技术图谱会涉及到可信计算、软硬件供应链安全、隔离技术、网络与存储的透明加密、密钥管理、可信执行环境等等。这其中每一个技术点都有软硬件结合发挥的空间。在整个技术体系的硬件方面,蚂蚁都有布局。蚂蚁有自研的TPM可信根芯片、自研的密码芯片和智能安全网卡,在可信计算、TEE等领域上也有了相当的工作积累。在整个技术体系的软件方面,蚂蚁也做了许多协调优化的工作。

对性能的优化,秦承刚介绍,也需要软硬件结合来进行。如果只通过软件优化,即使是借助Intel最新的 Icelake处理器的IFMA指令,部分算子也仅能获得10倍左右的加速能力,瓶颈很低。因此,未来必须借助专用的加速芯片或者是软硬件结合的方式对算法进行加速。通过GPU、FPGA甚至专用的ASIC芯片来解决密文运算的速度问题。

在性能的优化方面,蚂蚁目前尝试了对ECDH算法与全同态算法的加速。基于ECDH的加速器,一个隐私集合求交的运算(PSI)原本需要7个小时,现在11分钟就可以完成了,大约提升将近40倍。在全同态算法加速上,蚂蚁现在也已经有了一个初步的版本,目前还正在进一步的优化过程当中,也能够提升几十倍的性能。

2021年9月,在世界互联网大会上,蚂蚁集团正式对外发布由旗下蚂蚁链团队研发的摩斯隐私计算一体机。

这个产品利用诸多蚂蚁自研的芯片、硬件、软件实现了上述的软硬件一体化解决方案。在提升安全性和性能方面,都做了大量工作。

在提升安全性方面,摩斯隐私计算一体机有多处创新。

首先,在操作系统上,蚂蚁做了大量的安全加固,包括蚂蚁内部使用的安全容器与Linux系统。通过这些技术,可以把应用与基础设施做很好的隔离。同时蚂蚁也内置了可信软件栈,把可信计算和隐私计算做了充分的结合。

第二,在软件方面,一体机内置了蚂蚁自己的算法库,它可以支撑一些通用协议,也能支撑一些密码算法。同时,蚂蚁结合多种处理器做了TEE易用性的工作。此外,蚂蚁为隐私计算的应用提供了一套容器管理平台以及安全容器,在基础安全上集成了可信计算、远程证明等功能。

第三,蚂蚁已经将工作深入到芯片层面。其一,这款一体机搭载了蚂蚁自研的TPM可信根芯片,这颗芯片实现了可信计算组织TCG的TPM 2.0的标准协议,通过自研固件提升了芯片的安全性。同时,蚂蚁与芯片厂商定制了动态度量功能。动态度量是指在系统运行期间,能够对内存中的核心数据进行度量。如果某些核心的代码段被别人篡改了,可以及时发现并阻断恶意代码,这也蚂蚁在芯片上的一大创新。这颗芯片已经在蚂蚁内部数据中心得到了应用。其二,一体机的密码卡使用的是自研的蚂蚁卡,它搭载了一颗ASIC芯片,具备SM2、SM3与SM4的加速能力。同时也能提供密钥管理服务。这个密码卡的ASIC芯片已经获得了国密二级资质。
图 蚂蚁卡2代技术参数
来源:蚂蚁集团

在提升性能方面,摩斯隐私计算一体机也有所突破。一体机内置了隐私计算加速卡,这张卡同时有FPGA和GPU两个版本,分别适用于不同的场景。与前述ASIC芯片相结合,从目前国内市场看,一体机的加速性能是处于第一梯队的。

让秦承刚感到有底气的是,摩斯隐私计算一体机所搭载的技术和产品,都在蚂蚁的真实业务中进行过运行和验证,其可靠性是经受过实践考验的。

创业公司入局



除了蚂蚁集团之外,还有更多的创业公司正陆续出现在隐私计算软硬件结合的赛道上,在解决隐私计算的安全性和性能的问题上寻求单点突破。星云Clustar和融数联智是其中最早的两家。

星云Clustar的专长在算力提升方面,并且正在这一领域做得更为精深。

该公司由香港科技大学智能网络与系统实验室主任、高性能网络领军科学家陈凯创立于2018年,定位于以算力为核心的隐私计算技术商。成立之后的第二年,星云Clustar帮助微众银行解决了目前应用最广的联邦学习开源平台 FATE的算力问题,使FATE的性能实现1到2个数量级的提升(因测试平台不同,性能提升效果略有差异),成为FATE的算力提供商。

与FATE合作之后,面向隐私计算市场,星云Clustar推出了隐私计算加速卡和隐私计算软硬件一体机等软硬件结合的产品。

在算力提升方面,计算机单机算力提升,主要是要“算得快”;计算机集群内部和集群之间算力的提升,是要在“算得快”的基础上还要“传得快”。在“算得快”和“传得快”方面,星云Clustar都有所改进。

在“算得快”方面,星云Clustar自研了隐私计算加速卡,它可以解决联邦学习因使用同态加密而产生的计算压力与延时问题。根据星云Clustar提供的数据,相对于传统服务器,星云Clustar在联邦学习复杂的同态加密和解密计算实现1-2个数量的性能提升;密态乘法和加法效率提升2-3个数量级。

在“传得快”方面,星云Clustar有自研的高效网络技术GDR (GPU Direct RDMA) 。GDR技术主要是可以消除数据在单机之间的传输过程中不必要的数据拷贝,从而大大提升了通信效率,可使数据在单机间的传输时延降低75%,性能提升200%,极致性能提升450%。

星云Clustar CTO张骏雪告诉零壹财经,未来星云Clustar的技术和产品主要是沿着三根轴展开:更高性能、更多场景、国产化。

其中,在更高性能方面,星云Clustar正在努力降低FPGA的成本,使得未来单位价格购买的算力能进一步提升,这将使得在需要处理的数据量大幅增长的情况下,隐私计算的算力成本不至于大幅上升。张骏雪预计,明年星云Clustar能够使得单位价格购买的算力提升一倍。未来,还可以通过自研技术的进步、产品的大规模上量,使得算力的实际使用成本进一步下降。

2021年,星云Clustar的产品在不少大型机构做了POC测试,也与微众银行、招商银行、建设银行等大型金融机构达成深度合作。张骏雪的切身感受是,从2021年下半年开始,业内对硬件的关注和讨论就越来越多。市场最开始的关注点在于有和没有隐私计算系统有什么区别,但当不少机构开始尝试隐私计算系统之后,越来越多的机构开始比较哪个系统跑得快。经历了2021年与不少机构的POC测试之后,星云Clustar整个团队对于其软硬件结合的产品在2022年的更大规模落地充满了信心。

融数联智则在创立之初就瞄准了芯片研发,这是算力提升当中最艰难的部分。

融数联智创立于2019年8月,两年后,即2021年,融数联智正式发布首款隐私保护芯片(全称Privacy Preserving Unit,即隐私保护芯片,简称为PPU)PPU26x,并且官方宣布实测密态数据运算加速单元百倍的加速比。融数联智创始人兼董事长袁晔告诉零壹财经,PPU26x目前从在真实场景中的测试来看,大多数情况下能够使密文运算加速500—800倍。他预计,明年融数联智可以推出能够使密文运算加速千倍的产品PPU36x。

星云Clustar和融数联智之外,推出软硬件结合产品的隐私计算创业公司在不断增多。

2021年12月,在宣布完成超3亿元人民币Pre-A及A轮融资时,数牍科技也对外宣布,在隐私工程落地场景的同时,数牍前沿研究团队也实现了计算机体系架构层面的硬件突破。

在给零壹财经的回复中,数牍科技介绍:

数牍科技的软硬协同的隐私计算方案,围绕全国产化进行生产打造,不仅是上层的隐私计算平台,从底层芯片选择、硬件电路的设计,到国产密码算法研发,都是完全的国产自主可控,不断巩固自身产品体系的安全性和可靠性。

具体来讲,数牍隐私计算硬件可单独完成数据的“算、存、传”,将现有的隐私计算平台中涉及的算法、算子等核心运算进行能力下沉,使其部分托管至硬件环境中,并通过调用硬件的加速能力提升现有计算平台的整体性能。

经过结合硬件的可插拔的特性,能够非常灵活的对一台通用的服务器进行能力改造,将之变为隐私计算专用服务器,从而也提高了服务器资源和算力的利用效率,进一步降低计算资源开销。

就在刚刚过去的2月,隐私保护计算技术提供商锘崴科技宣布,与蚂蚁集团联合打造的锘崴信一体机正式发布。

据零壹财经了解,还有更多的厂商正在进入这个赛道,相关的产品正在研发、筹备当中。

与市场共舞



创业公司的入局,让蚂蚁的身影在隐私计算软硬件结合方面显得并不那么孤单。换个角度来看,这也是市场需求日渐清晰的信号。

数字经济发展和隐私保护的双重需要,正使得数据密态时代的到来成为大势所趋。蚂蚁集团副总裁、安全隐私技术委员会主席韦韬预测:“目前,密态数据处理的规模,就和数据挖掘最初的时候差不多,只在少量、简单的场景有所应用。未来,密态数据处理的规模,也会像当年数据挖掘一样,迎来爆发性发展。”

挑战随之而来。在隐私计算的软硬件结合方面,创新者们一方面需要小心翼翼地平衡巨大的研发投入与商业回报,一方面不可避免地正在迎来国际竞争。

事实上,星云Clustar的工作已经深入到芯片层面,但是要推出产品还需等待时机。

张骏雪向零壹财经透露,星云Clustar已经做完了隐私计算加速芯片的设计,甚至已经与芯片生产企业进行过对接。

在张骏雪看来,随着隐私计算技术发展与产业链不断突破,数据的运算方式、环境将愈发复杂,CPU、GPU等现有芯片将逐渐无法覆盖大规模密态复杂运算的需求,而利用FPGA等可定制算力硬件,推进密态数据专用AISC芯片和算力平台的研发与创新,将会是提升隐私计算在实际生产系统的效率的重要途径。但星云Clustar作为一家创业公司,必须权衡研发投入与市场回报。隐私计算作为非常新兴的行业,在商业化模式方面充满了“战争迷雾”,找准企业定位,明晰发展方向,与客户、产业链的互相配合,在“迷雾”中找到企业发展的生态位尤为重要。

聚集了大量芯片研发人才的融数联智却已经出发。

融数联智推出专用隐私保护芯片,在外界看来,这其中风险极大——芯片是一个技术和资本密集型产业,如果推出的芯片迟迟无法获得市场回报,这有可能使一家创业公司面临极大的挑战。

但对融数联智来说,这是深思熟虑的行动。袁晔告诉零壹财经,2020年融数联智的客户当中已经出现了对芯片的需求,客户需要处理大量高并发的数据。面对这个需求,虽然可以通过软件方案不断去优化算法模型以及密态运算的过程,但软件的所有指令都是提交给 CPU 做运算,部分提交给 GPU 做加速,不管 CPU 还是 GPU,对于整个性能的提升都是有瓶颈的。即使使用FPGA,仍然有瓶颈,FPGA对性能优化的上限是百倍。“从看到需求,到生产出较为成熟的芯片产品,估计需要3-5年。如果现在不做,到看到大量需求的时候再做,就有可能来不及了。”他说道。

现在,让袁晔感到稍有些欣慰的是,融数联智的芯片研发从全球来看处在前列,并没有晚,与Intel的进度几乎同步。“我们唯一担心的就是,会不会有些早了。因为隐私计算的发展仍然处于初期。但确定的是,我们的钱不会白投,路不会白走。”袁晔向零壹财经表示。

就在本文调研过程中,融数联智完成了新一轮融资。2022年2月28日,北京融数联智科技有限公司发生工商变更,新增股东为蚂蚁集团关联公司上海云钜创业投资有限公司。

从全球来看,隐私计算的软硬件结合,正在变成一个广受关注的领域,国际竞争在逐渐升温。

秦承刚最早看到一篇和密态运算加速相关的论文是2012年美国一所高校的博士生做的。从2015年开始,这个领域在学术界变得越来越热,越来越繁荣。MIT、微软、Intel都有相关的论文和工作成果发表。从2021年开始,更多业界的公司、甚至领头羊公司都开始关注这个领域。

2021年3月,美国国防高级研究计划局(Defense Advanced Research Projects Agency,简称DARPA)发布全同态硬件加速计划DPRIVE(Data Protection in Virtual Environments,虚拟环境中的数据保护项目)。DPRIVE寻求开发用于全同态计算的硬件加速器,与基于软件的全同态方法相比,它将大大减少计算运行时的开销、大大加快全同态计算的速度,从而使该技术更易于用于敏感的国防应用以及商业用途。该计划,有包括Intel在内的四个团队入选。

DARPA是美国国防部属下的一个行政机构,负责研发用于军事用途的高新科技。有文章这样评价它的作用:“DARPA通过孵化突破性技术以持续推动经济的发展,是美国生产率增长的核心引擎”。远的有GPS和互联网的原型ARPANET,近的有精确制导武器、隐形技术、无人机和脑机接口等,都是其推动发展的。

而在业界,2021年末,Intel开源了一个用FPGA加速全同态算法库的项目。欧洲也出现一家名为ZAMA的公司,开始做硬件加速方面的工作。

秦承刚判断:“如果真能做到全同态运算的速度几乎跟明文运算一样快。当这个芯片成为现实,隐私计算甚至云计算的技术体系肯定会发生演进。”

作为中国金融支付场景里科技领头羊公司,蚂蚁集团有更多的能力进行前瞻性的战略储备。一方面希望多年来的技术积累在解决市场面临的真实问题中有所作为,并且与市场协同进化,另一方面也希望在数据安全如此关键的领域,自身在相关技术的发展方面不要落后于国际同行。

从科技创新来看,秦承刚认为,隐私计算的软硬件结合正在开启一场长跑,其成果在未来数年中才能逐渐显现。他告诉零壹财经,现在在硬件的创新方面正处于体系结构的黄金时代。这是因为,移动互联网的飞速发展使得应用场景发展很快,上层的软件也发展很快,这使得在计算机底层进行支持的硬件甚至芯片都需要随之进行改变,进入了新一轮的创新周期。而从隐私计算的长远发展来看,硬件的演进是加速,算法的演进是变革,未来软件和硬件的创新会相互促进和推动。

从外部环境来看,在密态数据的处理方面,中国已经走到了世界的最前沿。由于监管环境的不同,许多国家仍处于数据收集阶段,而中国已进入数据融合发展阶段。在这一方面,中国拥有先发优势。

韦韬记得,三年前微软、IBM、英特尔的隐私技术专利水平是业界追赶的目标。但是在过去两年多时间里,这个差距正在被大幅缩小。

根据第三方机构IPRdaily与incoPat创新指数研究中心联合发布的《2020年全球新兴隐私技术发明专利排行榜》,截至2021年3月19日,中国有7家公司冲进前十,蚂蚁更是以740件的专利申请数量遥遥领先,微软居第二, IBM及英特尔,分别位列第五名及第六名。

图 2020年全球新兴隐私技术发明专利排行榜前十(截至2021年3月19日)
来源 :IPRdaily、incoPat

“中国在这方面将引领发展,数据行业有这样的机会。”韦韬最后表示。

End.

Copyright © 2021.Company NFTRR.COM All rights reserved.NFT