影视聚合站 科技 文章内容

银行业如何布局隐私计算

发布时间:2021-08-12 20:54:36来源:轻金融

空山不见人,但闻人语响——浅析隐私计算技术及银行业应用探索

来源:轻金融

作者:工行软件开发中心姚冕

“问渠那得清如许,为有源头活水来。”数据要素如同源头活水,以其可流通、可复制、可共享的特征,打破了土地、劳动力、资本等传统生产要素的局限性,融合贯通,百川汇海,在新兴技术的推动下激起建设数字中国的时代浪潮。数据要素的安全流通是促清水开源、保活水澄澈的前提,然而,普遍存在的“数据孤岛”现象,日趋严格的全球数据合规监管,隐私泄露事件频发导致的信任鸿沟,成为了制约数据流通与共享的主要因素,导致了数据流通中“不愿、不敢、不便”的痛点。

如何在保障各参与方数据安全的前提下实现流通共享和协作应用,是合规、安全、充分地挖掘和释放数据价值的关键。金融业作为数字化程度最高的行业之一,对数据要素合作共享、融合应用的需求尤为迫切。

隐私计算技术为解决数据流通与隐私保护之间的矛盾提供了有效途径。近年来隐私计算技术和应用的成熟度迅速提升,已经由实验室走向业界,并在一些场景落地实现。本文浅析隐私计算技术体系、在银行业的应用探索以及未来展望。

一、隐私计算概念与关键技术

“空山不见人,但闻人语响”。唐代诗人王维描绘的“但闻其声不见其人”的幽深、神秘意境,很好的契合了隐私计算“数据可用不可见”的精髓,形成了跨越时空的共鸣。

1.隐私计算基本概念

随着数字化进程的不断推进,海量数据散落在不同的组织机构和信息系统中。由于数据复制成本极低、数据合规监管日趋严格,各数据所有方不愿意、不能够共享数据,于是形成了一座座“数据孤岛”。

隐私计算(Privacy-PreservingComputation),是指在提供隐私保护的前提下,通过对多方的数据进行协作共享和计算分析,实现数据价值挖掘的技术体系。隐私计算并不是一种单一的技术,它是一套包含人工智能、密码学、数据科学等众多领域交叉融合的跨学科技术体系。隐私计算技术通过数据方、计算方、结果方的分离,打破了数据孤岛,真正实现数据的“可用不可见”。

隐私计算技术主要包括数据脱敏、匿名算法、差分隐私等传统隐私计算技术;多方安全计算、联邦学习、基于硬件的可信计算技术等新型隐私计算技术。隐私计算技术中应用了大量密码学协议,主要包括秘密分享、同态加密、混淆电路、不经意传输、零知识证明等。

2.隐私计算关键技术

当前备受业界关注的隐私计算关键技术主要包括三大技术路线,即多方安全计算、联邦学习、可信计算技术。

多方安全计算(SecureMulti-partyComputation),最早是由图灵奖获得者、中国科学院院士姚期智于1982年正式提出,是一种在持有秘密数据的参与方互不信任且没有可信第三方的情况下,安全地协同计算约定函数的技术和系统。多方安全计算基于密码学协议实现,通过基本运算操作组合实现衍生运算操作,解决多个参与方在不泄露自有私密信息前提下分享数据、共同完成一个函数计算的问题,从而实现保护各方隐私下的多方数据计算分析,如隐私求交、隐匿查询、联合统计。多方安全计算确保参与方无法获得正确计算结果之外的任何信息。

联邦学习(FederatedLearning),本质上是一种去中心化的分布式机器学习框架,能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模。联邦学习的核心思想是“数据不动、模型动”,即各参与方不交换原始数据,只交换密文形式的中间计算结果,保证各方数据不泄露。在原始数据不出本地的情况下,可借助其他方数据进行联合训练,建立共享的机器学习模型,从而达到提升模型效果的目的。根据建模数据的特征,联邦学习可分为横向联邦学习、纵向联邦学习和联邦迁移学习。横向联邦主要指各参与方数据集样本键值ID重合较小,样本特征重合较大,本质上是通过扩充训练样本数量提升建模能力,适用于同业间共建模型;纵向联邦主要指各参与方数据集样本键值ID重合较大,样本特征重合较小,本质是通过丰富样本特征维度优化模型效果,适用于跨行业增加外部样本特征维度。联邦迁移学习是指在各参与方的样本键值ID和特征重合度都极低的情况下进行联合机器学习,难度较前两者更大,目前尚处于研究阶段。

可信计算(TrustedComputation),是基于软硬件建立的一套安全运行环境,通过时分复用CPU或划分部分内存地址作为安全空间,构建出与外部隔离的安全计算环境,用于部署隐私计算逻辑,处理敏感数据,保证运行在其中的代码和数据安全。多方基于对可信计算硬件的信任进行数据的融合,并通过一套完整性度量机制保证系统运行的完整性未遭到破坏;外部多方数据进入可信执行环境前使用密文传输,在可信执行环境中解密后进行数据融合计算。

3.隐私计算技术发展趋势

随着密码学技术、硬件技术的快速发展,隐私计算技术路线也随之高速演进和变化。多方安全计算、联邦学习、可信计算三大主流技术呈现互相交织、吸收、互补、融合的发展态势。多方安全计算具有更加安全的联合数据分析能力,可以增强联邦学习数据协作过程中的安全性,例如可使用多方安全计算中的隐私求交技术实现纵向联邦学习中各参与方公共样本ID的计算。基于硬件的可信计算在通用性、计算性能、易用性方面具有优势,与纯软件的隐私计算解决方案融合应用,可显著提高其运行效率。

隐私计算技术与区块链技术的融合应用,可促进更广泛的数据协作,也是重要发展趋势之一。将区块链技术对计算的可信证明应用到隐私计算中,可以在保护数据隐私的同时增强隐私计算过程的可验证性;同时,隐私计算技术可以为链上数据提供隐私保护能力。

二、隐私计算实施方法

为了实施部署企业级隐私计算,需要综合考虑技术体系架构、数据来源、业务应用策略、商业模式、管理保障和协同等因素。

1.构建隐私计算技术体系,支撑数据安全流通

一个完备的隐私计算技术体系应具备以下几项能力:一是底层安全保护能力。基于秘密分享、同态加密等密码学协议和可信执行环境,实现软硬件结合的全方位安全保护。二是隐私计算服务能力。基于底层安全保护技术,提供联邦建模、联邦预测、联合统计、隐私求交、隐匿查询等隐私计算服务。三是运行支撑能力。提供统一的运行环境,为隐私计算应用设计、流程开发等提供技术支撑,满足各业务领域的隐私计算研发及运营管理需求。四是实现全方位的运维管控,支持对任务调度、运行状态、数据管理、用户管理、异常事件等进行可视化监控和管理。

2.融合内外部多维度数据,丰富非金融属性数据

数据是隐私计算的核心,厘清数据来源并对其分级分类,是隐私计算金融业实践的基础。一般而言,可将数据分为三种类型,第一方数据(自有数据,自身采集或运营过程中产生的数据)、第二方数据(合作伙伴数据)和第三方数据(公共机构、互联网公司等机构拥有的数据)。对于每类数据,金融机构需要划分安全等级、评估使用条件,包括数据来源渠道可靠性、数据更新及时性、数据质量有效性、数据内容完整性等。

金融机构与其他机构间的数据合作存在以下4类模式:1)“银行+政务开放数据”,由政府主导开放电子政务数据资源,银行利用政务数据提升金融服务水平,提供普惠金融服务,推动数字政府的建设。2)“银行组织、联盟、协会或银行+银行”,在银行联盟、行业协会或银行之间开展数据合作,共享金融数据资源,提升行业整体服务水平和风控能力,促进行业共同发展进步。3)“互联网企业+银行”,互联网企业和银行之间进行数据合作,银行利用互联网企业的社交、消费、生活等行为数据为金融服务提质增效;互联网企业利用银行资金渠道拓展业务领域,双方相互促进各自业务发展。4)“运营商+银行”,银行利用运营商通讯数据开展客户营销、运营优化和风险防控;运营商通过合作增加获客渠道,或通过数据资源获得收益。

三、隐私计算技术在银行业应用探索

隐私计算技术与营销、风控、监管合规等银行业务领域的深度融合应用,释放了金融创新活力和数据要素价值,推动了银行数字化转型升级。

1.客户营销

在传统的营销体系下,由于无法及时、精准掌握每位客户的需求偏好,银行提供的针对客户群体的产品和服务千篇一律,营销效果不尽人意。银行需要完善的,精确到“点”的客户360度画像,然而现有的客户数据分散在不同的系统,数据相互隔离,难以通过数字化的手段为客户进行全方位的画像。

通过隐私计算技术,可以安全地融合多方数据源,构建“千人千面”的精准营销模式。一是发掘客户实时需求,及时组织好匹配的产品与个性化服务,以响应客户的需求,将消费场景转化为营销场景,使得营销过程更针对性和指向性,提升用户的转化率。二是将融合的多方数据结合业务特征进行关联分析,在保护各方用户数据隐私的前提下,输出客户对应的消费习惯、净值等标签。根据标签将目标客户分群,挖掘潜在需求人群,根据客群的多种需求进行“交叉营销”。三是引入客户营销效果反馈的量化分析与评价机制,不断优化联合营销模型,调整营销策略。通过多方数据安全融合的精准联合营销,可达到“想客户之所想,荐客户之所需”的智能营销效果,有效降低营销成本,增强金融服务能力,提升客户的转换率、用户的留存率以及交叉渗透率。

2.智能风控

传统信贷管理体系由于客户数据维度匮乏、数据量有限,存在贷前客户信息收集困难、信息准确性难以验证;贷中难以实时获取客户信用、产品交易等信息,无法实时判断客户的经营情况、行业整体发展状况以及在交易环节可能存在的风险;贷后信息滞后、难以准确、及时反馈。

通过隐私计算技术与合作机构展开政务、企业等多维度数据融合共享,联合完成风控数据分析、基于客户360度画像的数字信用评级模型训练和风险决策等任务,可有效降低信息的不对称性与不透明性,提升信贷风控能力。金融机构可改变仅利用客户财务经营信息、抵质押担保信息等的传统授信审批模式,实现面向业务场景和交易过程的授信,并结合长尾客户“额度小、期限短、需求频繁、办理要求快”的贷款需求,推出高效、便捷、智能的“自动化、直通式”融资服务模式,提高融资效率,降低融资成本,服务实体经济。

3.监管合规

2021年4月,人行发布实施《金融机构反洗钱和反恐怖融资监督管理办法》,随着《办法》发布,反洗钱工作已经从身份识别转向全民客户尽调时代,名单监测,客户信息的完整有效,勾稽关系的合理性需综合多方数据进行分析。数据是反洗钱和了解你的客户(KYC)的基础,通过融合多方数据源,可以精准了解你的客户(KYC)和分析挖掘可疑交易规律。

通过隐私计算技术,可以整合内外部收集到的各种数据,尽可能消除申请及交易等环节的信息不对称问题,并与客户行为建立关联,从而更全面地了解客户、评估客户。基于多方数据源还可建立丰富的反欺诈模型、规则以及反欺诈知识库,对客户进行持续识别和监控,增强反洗钱风险洞察及溯源核查能力。

四、隐私计算未来展望

2020年被业界称为隐私计算元年,隐私计算技术逐步走向商用,各方积极布局探索。目前隐私计算需要在以下几个方面完善和攻坚:1、隐私计算产品在计算复杂度、多方交互效率、模型性能等方面存在瓶颈。2、不同隐私计算产品互联互通存在障碍。3、缺乏专注于隐私信息共享和流通的法律法规,存在隐私计算应用合规痛点。4、在技术和行业标准方面存在空白,国内亦缺乏权威规范的认证机构。

展望未来,学术界与产业界携手共进,正通过以下几方面大力推动隐私计算技术的发展和应用:1、通过优化算法和协议设计、多种技术融合、软硬件协同等途径提升隐私计算效率和性能。2、建立隐私计算互联互通标准。3、完善政策法规,厘清合规边界,解决隐私计算金融应用存在的合规痛点,出台政策鼓励数据分享、支持隐私计算产业健康发展。4、制定、完善标准和认证体系,为行业树立技术发展和应用的度量标尺,促进隐私计算推广应用。

声明:本文仅代表作者个人观点,不代表所在单位

【轻金融好文】

1、

2、

4、

5、

6、

7、

8、

9、

10、

© 2016-2017 ysjhz.com Inc.

站点统计| 举报| Archiver| 手机版| 小黑屋| 影视聚合站 ( 皖ICP备16004362号-2 )