微众银行杨强:金融行业的AI应用及开源生态

7月26日,微众银行首届金融科技开放日在深举行。本文为微众银行首席人工智能官、香港科技大学计算机系讲席教授、国际人工智能联合会理事会主席杨强的演讲内容。

微众银行杨强:金融行业的AI应用及开源生态

尊敬的各位领导、女士们、先生们:
大家早上好!
今天我非常荣幸有机会跟大家分享我们对AI方面开源生态的想法和做法。我们看到现在AI在全世界范围内蓬勃发展,在开源方面源源不息。那我们在金融方面如何做到开源?我们先看看开源几个不同的方面,首先需要建立开放技术和合作伙伴,同时建立标准、机制以及行业应用。因此,我们有很多的工作要做。
首先,AI可以作为支持业务的工具,助力金融业务发展。同时,我们可以进行探索,运用AI产生新的业务模式。这两个任务是我们AI技术人员肩负的。在金融方面的场景非常多,如金融风控、投顾、客服、投研、营销等,我们在过去一两年做了不懈的努力,搭建起了非常强大的AI技术能力。具体来说,我们的努力分为四方面:
微众银行杨强:金融行业的AI应用及开源生态
图1:金融AI技术人员肩负两大任务
第一,服务生态。具体来说是建立新一代的人机交互。其中,人和机器本身形成一个生态,另外,不同的用户之间以及不同的机器之间也形成一个生态。其核心是提升服务质量,提高效率。
第二,营销生态。让我们的声音散发出去,让更多的人知道我们具备金融服务的能力。如何在金融领域达到这一点,确实是一门大学问。
第三,资管生态。这是指风险管理、资产管理的生态。在这个生态里,我们建立了团队并明确了发展方向。
第四,大数据生态。也就是我们所说的联邦学习引起大数据合作、联合合规的生态。
微众银行杨强:金融行业的AI应用及开源生态

图2:微众AI团队构建AI在金融领域的四大生态

服务生态,也就是新一代人机交互。生态的主角是银行客户服务部门、终端用户部门、安全部门以及合规部门。举例来说,大家想到服务,首先想到客服。而客服包括几个不同的金融流程,如业务咨询、身份核验、资料审核、操作等。每一个步骤都可以用智能机器人赋能,目的是提高服务质量,减少费用。
我们自研了一款语音客服机器人,它不仅仅可以识别语音,还能做意图的理解。它有几个很强的特点,如可以进行多轮对话、理解对话的内容、并产生模拟人类客服的语言等。从技术方面来讲,我们涉及人工智能、机器学习几个非常新的方向,包括多标签分类、意图排序、多层语意理解、细节理解、否定判断、语意分析等。在客服和客户沟通过程中,我们机器人可以监测,并且实时发现多轮对话里有没有需要辨别风险的部分,识别出来并且给客服人员实时提醒。比如在某个车险过程中可以识别车险的报告人是不是有欺诈的行为。我们知道每一个客服都有录音,这个录音本身是很重要的资料,我们可以把它想象成为考试的试卷,我们的机器人可以成为判考题的老师,他可以给客服质量打分,这是客服质检机器人。每次客服结束,他可以观察客服流程是否合规,哪些地方需要提醒和注意。整个流程需要人工智能有很深层次的语言理解以及模仿人的语言行为的能力。
OCR文字识别机器人。我们已经全面实现了自主研发,并可以在不同的具体场景下落地该模型。该应用特点在于需要经常应用于新的领域,比如我们要在昏暗或者抖动的场景识别一个证件。对于类似这样的新的领域来说,有标签的数据极为珍贵并且非常稀少。我们用了人工智能中的迁移学习技术,把我们通用模型赋能给具体场景,用很小的数据可以建立很好的模型。这使得我们可以把这个功能发挥在方方面面。这并不是一次做成,N次使用,而是在每一次新场景出现时,都可以产生新的模型。我们知道人工智能的发展是对抗学习,所谓对抗学习是它可以模仿人的能力自动生成虚假人脸,有时候可以骗过人工智能系统。针对这样的新型技术,我们进行了深入学习对抗研究,我们的机器人可以反其道而行之,可以识别人工智能产生的虚假人脸。这样即使在人工智能的场景下,坏人魔高一尺,我们能道高一丈。
我们有这么好的金融服务和金融产品,我们如何广而告之,让大众知道这些金融产品?这里包括广告商、投放媒体、个体用户、企业用户,不同的角色都是我们生态中的一员。传统互联网广告有很多积累,但也有很多缺陷。传统的互联网广告只关注点击,在一个很长的链条里,它只是取前面很短的部分。而用户的转化问题,特别是我们需要营销高价值、低频度的产品时,传统广告的传播方式往往无能为力。在此情况下,我们研究了针对高价值、低频度产品的营销策略。这种营销策略是基于人工智能技术能力——强化学习+迁移学习。通过两者AI技术能力自研出长链路优化算法模型,该模型可以把非常长的链条,也就是我们现在屏幕上看到的,从第一步展现到最后一步授信通过的整个长链条打通,使得最后一步的转化成为中间每一步的驱动力。这个算法能力可以用全局的观点统筹整个运作,效果比传统的互联网广告好很多,尤其是对于高价值、低频度的金融产品来说。
这是一些例子,我们的平台包括可信营销平台、安全数据管理平台,还有基于用户路径的强化学习平台。它的能力遍及各个高价值、高质量的媒体。比如在小微企业贷方面,我们营销的目的是找到有需求并且靠谱的小微企业主。如何找到他?就像物找人一样,同时也有人找物。在双向寻找过程中,我们平台起到关键的作用,尤其是像这里展示的企业贷款,我们对于不同的企业主可以根据个性化展示不同的广告、图像,这个图像可以根据地域、行业、时空等很多不同的信息维度自动产生的,并取得了很好的效果。
微众银行杨强:金融行业的AI应用及开源生态
图3:微众AI打通广告全链条,有效提升转化率
刚刚谈到营销,接下来我们看一下资产管理和风险管理。我们的生态用成语表示是“上天入地”,上天,我们通过卫星的数据。入地,我们通过互联网的数据。线上线下的数据结合,通过人工智能和可视化有机结合形成非常强大的资管平台。数据的来源可以是各个方面的,关键数据包括另类数据、新型数据,这些数据有机的结合使得我们产生高维度的资产画像。这个资产可以是宏观的,包括经济趋势。也可以是微观的,包括企业的生产状态。
我们知道在国际上利用全方位的数据产生资管画像的实践,已经在西方蓬勃的开展了。我们中国有一定的路径需要改善,我们力争在这方面做领头人,把西方有用的经验在中国切实的落地。我们平台包括利用人工智能、可视化技术和大量另类数据进行以下三类研究:智能投资研究、投资组合分析和智能风险管理。
前面Henry提到联邦学习合作生态,我们在这个领域中观察到,有必要构建数据联盟。现在一家一户单打独斗的数据远远不够现在银行人工智能、大数据的发展态势,我们要建立的生态包括数据源、开源生态、企业联盟生态和标准化生态。
把人工智能、人工智能向善、技术向善提到桌面上,我们看到企业对于人工智能的隐私保护非常关心。与此同时,我们看到数据并没有我们想象的那么丰富,我们把不那么丰富的数据称之为小数据。有标签的数据、高质量的数据、新数据往往占少数,不足以支持我们所说的深度学习这么大规模的数据消耗的需求。
世界上IT巨头,比如在美国的Facebook遭到美国政府巨额罚款,主要原因是用户隐私泄露。隐私保护、安全及合规问题现在变得越来越重要。我们微众银行AI团队在这个方面做了领头羊。世界各地监管趋严,欧洲提出GDPR,美国提出CCPA,我国的立法也走在正规化路径。在此背景之下,我们提出了联邦学习。大概思想是我们有多个数据拥有方,过去我们需要把这些数据合并起来形成大数据,由于以上的原因,合并数据越来越难。而联邦学习的思路是让数据在本地不动,我们的模型可以在不同的机构之间穿梭。不是模型本身在穿梭,而是模型在沟通。通过加密状态下的参数沟通,这项技术使得各地持有的那部分模型都能获得成长,最后形成生态。这个生态里大家会共享一个成长起来的模型。这项技术的成功落地取决于多方面,不仅仅是人工智能,还有分布式计算、加密算法等。把这些合并起来,我们还有激励机制,这里要引入博弈论和经济学。
我们尝试在这个方向利用联邦学习把不同的行业合并、聚合起来。比如银行和监管进行反洗钱建模;互联网和银行进行联合信贷风控的建模;互联网和保险进行联合权益定价建模;互联网和零售大量提升零售的生产效率等。
这里举一个微众银行和合作企业有进行联邦学习合作的例子,我们利用这家企业的发票数据和微众的信用数据,形成联邦合作,建立共享模型,最后取得非常好的效果。第二个例子跟上面的例子不一样,这是计算机视觉领域,我们知道在工地有很多监管的摄像头,这些摄像头的作用是帮助政府监管工地的安全生产,比如工人有没有戴安全帽、有没有火灾或者有没有人吸烟等。很多工地的摄像头来自不同的机构和部门。如果我们有能力通过联邦学习的方式,在保护隐私的前提下把这些信息聚合起来,这会形成非常强大的模型自动监管。我们做到了这一点,我们跟深圳互联网人工智能顶尖公司合作,最后做成系统的落地,这是业界首个案例。
以上的例子告诉我们,我们可以联合不同领域的机构,通过联邦学习形成战略联盟。这个联盟的支持架构叫做FedAI,这是联邦学习的人工智能架构。这个架构获得了学术界的广泛认同,并在中国人工智能大会、国际人工智能大会得到了关注和讨论,我们将在两周后于澳门举办第一个有关该论题的国际研讨会。同时我们把这个生态开放开源,我们刚刚和Linux基金会联合发布开源,这是第一个开源的联邦学习的项目。
我们积极引领联邦学习标准的建立,包括国家标准和国际标准。同时,这个生态受到各方热烈响应,有很多不同的机构和个人积极加入生态里,为联邦学习开源平台加入新的功能、新的模块。
综上所述,我们在联邦学习、大数据联合生态,资管平台的生态,营销的生态和服务机器人的生态都在做不懈的努力,希望各位嘉宾所在的机构能够参与到我们的生态建设中。
谢谢大家!

-----   End   ---

本文由 产业新干线 作者:NovaLink 发表,其版权均为 产业新干线 所有,文章内容系作者个人观点,不代表 产业新干线 对观点赞同或支持。如需转载,请注明文章来源。

发表评论