加入收藏 | 设为首页 | 会员中心 | 我要投稿 应用网_阳江站长网 (https://www.0662zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 动态 > 正文

从原理到落地,支付宝如何打造保护隐私的共享智能

发布时间:2020-07-17 23:21:50 所属栏目:动态 来源:站长网
导读:文/周俊 随着互联网技术发展,人们对于隐私保护的要求不断提升,世界各国纷纷都出台法律法规保护人们的隐私。前段时间我国发布了《民法典》,明确了个人隐私权和信息保护的办法。而这对于数据时代的技术提出了更高要求。 本月初,蚂蚁资深算法专家周俊在2020年

文/周俊

随着互联网技术发展,人们对于隐私保护的要求不断提升,世界各国纷纷都出台法律法规保护人们的隐私。前段时间我国发布了《民法典》,明确了个人隐私权和信息保护的办法。而这对于数据时代的技术提出了更高要求。

本月初,蚂蚁资深算法专家周俊在2020年AI开发者大会上,分享了支付宝如何利用共享智能技术保护数据安全与用户隐私,我们将内容整理分享给大家。

背景介绍

在金融服务当中,核心三要素是场景、数据和智能化,在场景里面有大量微贷、保险、支付、财富等等相应金融场景,由于海量用户跟场景有大量的交互,所以会形成大量的数据。

在金融场景里处理海量数据里面临几项大挑战:

第一是对时间敏感,用户随着时间在金融场景下的兴趣会发生比较大的变化。

第二由于交互量很大,所以会沉淀下来非常多的数据,并且数据跟传统电商不太一样,由于金融业务多样化,有支付、保险各式各样的服务,带来数据本身也有很大多样性。并且金融场景是互相联系的,要想解决保险、支付、微贷等问题,必须站在更高角度,给出系统性的解法。

最后是安全和隐私,安全跟隐私是整个金融服务迈向智能时代最关键核心的技术,有了对安全和数据隐私理解之后,才能够给大家提供更好金融智能服务,才能将普惠金融服务更多的人。

当前,各家企业与机构都积累了大量的数据,但是由于政策与技术的原因,数据无法打通,形成了一个个的数据孤岛。打造开放平台、共享数据、创造更大价值成为了很多互联网企业的一个迫切的需求。但是,开放平台的建立需要解决以下几个难点:

第一,数据共享在引入巨大价值的同时,也存在泄露的风险。比如说国外社交网络巨头5000万用户数据隐私泄露事件,告诉我们如果数据共享链路不安全,会带来巨大的风险。

第二,公众和政府对隐私保护和数据安全重视程度越来越高,所以欧盟GDPR法律正式实施之后,有很多国家纷纷效仿,立法保护大家的隐私。

第三,对于整个金融科技行业而言,怎么样设计满足安全、隐私和新监管要求下的模式,是摆在所有科技行业从业者面前一道难题。

作为一个科技公司,我们迫切希望能有相应的技术承担社会责任,能够给到用户更好、更安全隐私保护技术,从而给用户提供更好的服务。

从原理到落地,支付宝如何打造保护隐私的共享智能

从技术角度来抽象我们遇到的问题,则是:如何让各自拥有数据的双方或多方机构,在不泄露数据隐私的前提下,进行数据融合建模?

在建模里主要有两个大场景,一是水平切分,多个数据方之间特征空间是一样的,每个数据方持有不同的数据。二是垂直切分,数据方持有不同特征空间,每一小块都是完整的多维空间。水平切分主要出现在面向C端用户的场景和一些图像、语音数据的场景,而金融机构之间的合作,则往往以垂直切分为主。

怎么样达到水平切分和垂直切分情况下构建安全保护隐私联合建模方案呢?我们希望达到三个目标,第一隐私数据不能出域,第二模型隐私不能泄漏,第三中间交互信息不能反推隐私信息。

这里面临很大挑战,首先隐私保护机器学习是交叉学科,它面临着又要懂机器学习、密码学,还要对工程系统有更好理解才能打造够工业界的系统。第二,这对工业界来说属于比较前沿的方向,可借鉴的工业级方案非常少。第三,对于工业界追求安全和效率有一个平衡,这样才能更好处理海量用户和海量数据。

蚂蚁共享智能主要技术

我们提出方案是共享智能隐私保护解决方案,它需要解决问题是多个参与方,并且每个参与方跟数据方不是信任情况下,能够聚合多方信息进行数据分析和机器学习等AI运算,并且能够确保各个参与方之间隐私不能泄漏、数据不能滥用。涉及主要技术包括可信执行环境、安全多方计算、差分隐私等技术。

从原理到落地,支付宝如何打造保护隐私的共享智能

接下来看一下技术主要涉及一些技术点,首先是差分隐私,差分隐私这个技术提出来时间不短了。顾名思义,差分隐私主要是用来防范差分攻击,即攻击者对数据库进行多次略有差异的查询来推测出原始数据的信息。差分隐私的目标,就是让攻击者在相似数据库上的查询结果难以区分。那么最常用的方法,就是对结果添加噪音。噪音的强度,可以通过需要隐私保护的级别计算得到。隐私保护级别越高,添加的噪音就越大,对结果的扰动就越大。

差分隐私可以有效地保护计算结果的隐私,但是对于多方联合计算过程中的隐私保护,还需要用其他的技术。

从原理到落地,支付宝如何打造保护隐私的共享智能

共享智能第二项技术是可信执行环境,它是基于硬件的解决方案,主要解决两个大的问题,一个是内存窥探和软件篡改问题,通过内存中开辟加密空间,称为飞地(Enclave)保护来自虚拟机、操作系统和恶意程序的攻击。其次为了确保软件篡改涉及远程认证RA机制,确保在这里执行程序是经过用户认证和授权的程序,通过密码箱飞地的设计,可以在这里完成大量的保护隐私计算。

从原理到落地,支付宝如何打造保护隐私的共享智能

第三项是多方安全计算技术,包括秘密分享、同态加密和混淆电路。用的比较多的有两个,一个是秘密分享,秘密分享通过原始数据随机拆分,得到密态数据之后,多方协同密态下面进行计算,之后得到相应计算结果,整个优势是计算复杂度比较小,因为有大量密态数据交互,所以网络通讯比较大,同时需要多个参与方参与。

第二同态加密,在密态下面对密态数据进行加密,在密态下面进行计算得到结果,跟明文下得到结果是一样的,通过这样一个原理来实现密态下计算得到相应结果,相对来说计算复杂度要大,因为加减密计算复杂度是非常高的,但是网络通讯相对比较少,因为中间只需要单次通讯就OK了。

这两个技术中间有很强的安全性和封闭性,安全性是这里没有任何信息泄漏,可以很好进行复合运算。

共享智能实施架构概述

介绍完前面背景信息和主要技术之后,我们看一下共享智能怎么实施,怎么用技术解决前面提到的核心问题。

基于TEE的共享智能

从原理到落地,支付宝如何打造保护隐私的共享智能

首先是基于TEE共享智能,首先利用SGX搭建分布式的TEE可信计算环境,里面有相应计算模块和认证模块,各个参与方之间相应的数据密文传到可信计算环境中完成分布式的计算。

(编辑:应用网_阳江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!