金融前沿讲堂丨杨强为什么要用联邦学习来做

北京看痤疮的好医院 https://m-mip.39.net/baidianfeng/mipso_8578752.html
编者按

年3月17日晚,应巴曙松教授邀请,微众银行首席人工智能官杨强教授做客“北大汇丰金融前沿讲堂”,带来主题为《用户隐私、数据孤岛和联邦学习》的精彩讲座。本文节选了部分讲座视频和文字实录,以飨读者。

精彩视频

以下为视频部分文字实录

数字化的普惠金融正在中国蓬勃发展,是未来希望的曙光。中国也在做类似于尤努斯模式的微型信贷,而且在一些农村做得不错。除此之外,一些企业也在做。中国的网络银行、互联网银行比如网商银行、微众银行等,这些大型的数字化机构的效率非常高,两三年的时间覆盖了万到万的客户。

我们举几个例子给大家看,首先看一下传统的金融行业,这就是为什么要用联邦学习来做风险控制。

风险控制现在不是靠专家了,现在是靠数据了。

这个数据往往是永远不够的,一个是不够全面,一个是非结构化,很难解析处理,还有一个是滞后的,那么怎么办呢?我们就可以利用联邦学习和各方的实时大数据建立一个联邦学习的网络来进行各种各样的金融的活动,这里列举了风险控制、投研、营销、理赔、保险、支付等等,我就不一一过了。

国家层面对联邦学习也开始重视起来,像《中国智能金融发展报告》在年就专门有一个chapter(章节)来讲联邦学习的特点。

这个例子就是怎么用联邦学习来做反洗钱,我们知道洗钱是一个非常小概率的事件,大部分人都不会去洗钱,因为我们都没有这么多钱要洗。但是真正洗钱的人是非常精的,不会在一家银行去洗钱,会在很多家银行,每个银行做一点点的操作,除非能够把这些银行串起来,否则发现不了洗钱的动作。

联邦学习可以让银行之间数据不出库,打消很多顾虑,同时建立一个横向联邦。因为他们之间的特点,特征都是类似,因为贷款类型都类似,特征都类似,transaction也类似,但是他们的用户不同,这就是我们所说的“横向联邦”。

他们的用户里面有很多行为实际上并没有,因为银行的特征特别特别少,我可以借用互联网公司有很多行为,但是却没有我们所说的“Y”,也就是目标。我们就可以和互联网公司建立一个“纵向联邦”,通过互联网公司把我们的特征空间特别特别强地壮大,这样的一个系统可以发现一些特别难以发现的洗钱的行为。这个是和央行(人民银行)一起合作做的项目。

在做贷款的时候很多银行没有自己的数据做风险控制,只有靠关系,我们现在知道国家现在推广的是小微企业的扶持、小微企业的贷款。如果能够应用上大数据就能够把贷款周期大大缩短,需要这些数据能够联合建模。

大家看右图,这个蓝线代表联合建模的效果,引用的数据集增多的情况下,效果也是也是增加的,增加到红线以上,这个模型以上就可以用了,也就是就超过人的能力,就可以被上线去使用。

我们用在什么样的公司呢?有很多例子,比如说金融科技、数据服务、互联网公司、支付公司以及其他的公司,加在一起形成一个联邦的数据网络。

延伸阅读:讲座现场

北京大学深圳研究生院副院长、北京大学汇丰商学院副院长王鹏飞教授在致辞中对杨强教授的到来表示热烈欢迎,并介绍了杨强教授的基本情况。杨强教授现任微众银行首席人工智能官,香港科技大学计算机与工程系讲座教授和前系主任,第四范式公司联合创始人,AAAI-大会主席,国际人工智能联合会(IJCAI)理事会前主席,香港人工智能与机器人学会(HKSAIR)理事长,智能投研技术联盟(ITL)主席,华为诺亚方舟实验室首任主任,ACMTIST和IEEETRANSonBIGDATA创始主编,CAAI,AAAI,ACM,IEEE,AAAS等多个国际学会的Fellow。领衔全球迁移学习和联邦学习研究及应用,著作包括《迁移学习》《联邦学习》等。

王鹏飞教授致辞

讲座开始,杨强教授首先回顾了人工智能的发展史。他指出,人工智能从出现到现在已有60多年,人类经历了不同阶段的认知。数据作为语言,是真正使得机器和人工智能腾飞的关键。但是在现实中,数据往往是分散在各地的,各地之间的数据很难沟通,部分数据以“数据孤岛”的形式存在。而联邦学习就是在虚拟世界把物理分散的数据聚合起来,在聚合的过程中保护了用户的隐私安全。

杨强教授在讲座中回顾人工智能的发展史随后,杨强教授指出,近年来,国家对数据隐私的保护立法越来越严格。不同领域和不同区域都有相关法律法规出现。联邦学习的思想就是支持分散数据的合作,能够保证数据不动,保留在本地,但模型可以沟通。杨强教授以基于安卓系统的联邦学习模型为例,介绍了横向联邦学习机制。此外,对于不同机构的不同数据特征,如果有较多样本的重叠,可以采用纵向联邦学习的模式,实现模型的加强。联邦学习研究是目前全球


转载请注明:http://www.niriliyaa.com/sydt/8509.html