【第二届中国区块链与金融科技论坛】数美科技创始人兼CTO梁堃:智能风控在金融行业的应用

2017-11-07 09:45:01  来源:CIO时代网

摘要:2017年11月5日,由中国新一代IT产业推进联盟指导,CIO时代学院主办,北京大学软件工程研究所、金融电子化杂志社联合主办,CIO时代APP承办的“第二届中国区块链与金融科技论坛”在北京大学隆重举行。数美科技创始人兼CTO梁堃发表了以《智能风控在金融行业的应用》为主题的精彩演讲,
关键词: 智能风控 金融
  2017年11月5日,由中国新一代IT产业推进联盟指导,CIO时代学院主办,北京大学软件工程研究所、金融电子化杂志社联合主办,CIO时代APP承办的“第二届中国区块链与金融科技论坛”在北京大学隆重举行。数美科技创始人兼CTO梁堃发表了以《智能风控在金融行业的应用》为主题的精彩演讲,以下为演讲实录:

\

  很开心有机会能跟大家分享一下我们的一些想法和实践。这次我分享的主题是“智能风控在金融行业中的应用”。

\

  背景与挑战
 
  背景,大家应该还是很清楚。今天,包括一些国家政策支持普惠金融,让更多人获得这样的服务。但是普惠金融面临的客群在不停的下沉。新的普惠金融服务对象,可能是没有接受的传统金融服务,在下沉过程中,这些人的信用记录甚至基本的银行流水收支可能都是缺失的。当给更多的人提供服务的时候,我们怎么样去给他做风控?成了一个巨大的挑战。在普惠金融中面临的欺诈、风险可能分为两大类:第一类就是欺诈风险,这一类里面分成了第一方欺诈和第三方欺诈。比如说欺诈风险里面常见的身份盗用、资质包装、老赖。第二类就是信用风险,当他做了个人的现金贷款或者消费分期之后,他的负债能力怎么样、收入水平怎么样、消费习惯怎么样、是不是有能力把分期或借贷的信贷还上,这都是面临的信用风险。
 
  传统上讲,比如说信用卡很可能是信用风险中占主要地位,欺诈风险其实是偏少的。但是在今天普惠金融的情况下,其实欺诈风险反而占了更重要的地位,信用欺诈是偏少的情况。在欺诈风险这块,我们对手是非常成熟的。比如说一个完整的灰色的产业链,从最早的身份资料的获取,可以通过钓鱼、购买,甚至是通过传统撞库手段去获得大量的合法的身份资料。获得身份资料之后,就是要对这些资料进行资质的包装。因为传统征信手段更多是看这个人在银行的信用历史、消费流水、运营商的一些通话记录,而这种三个维度的包装也成为了我们对手包装的重点,他们会非常着重的包装这几个方面。真正在实施之前还有另外两个环节,比如可以批量的用自动化的方法养号,养个三个月到六个月,使他非常像正常人,可能会用代理IP等形式使得他的地域分散很广,而不是说集中在一个地方。在这之后,社会上存在一种人,我们把他叫做“探路者”。他们专门探测各个风控平台、信贷平台的漏洞。不论是互联网金融还是传统银行在提供消费分期服务,都会系统的尝试这些系统的风控漏洞,然后把这些漏洞写成攻略在网上进行出售。最后,真正骗贷的实施人或者高风险用户,他们会购买这些所有的产业链上的服务来完成自己的信贷。
 
  在普惠金融快速发展的时候,风险成为一个非常重要的问题。现在可能国内大概有几千家提供新金融、普惠金融服务的公司。包括城商行、股份银行也积极成立这样的部门做这样的业务,在这个情况下,面临的客群又在不断下沉,我们怎么做风控?用传统方式做风控会有两个问题:第一,新的普惠金融的客群,信用卡流水缺失是比较严重的,足以支撑对风险的判断。第二,就是对手的成长。其实对手很清楚现在的风控体系和传统的风控体系是基于这些的,我们是不是可以把更多数据用到风控里面去?我们提出基于大数据和人工智能的风控体系。
 
  大数据的发展带来了非常大的机遇。最基础的是今天的计算能力和存储能力比原来扩大几千倍、几万倍甚至几十万倍,一个人的衣食住行等各个方面,都产生各种各样的数据,这些数据也给我们提供了基础的原材料,使得我们可以基于大数据做这件事情。其次,大数据涉及的方面、种类已经不仅仅是单一的,比如说银行的交易记录、信用历史、车贷、房贷等已经涉及到生活的方方面面。我们对手包装时可以包装银行记录、运营商记录、电商购物记录,但是他很难包装一个正常人在生活中各个方面的情况。第三,就是人工智能算法的进步。为我们提出更多机会,可以把这些新的算法使用起来,应用在这个领域里面。最后,在广泛的互联网服务里面,无论是搜索、推荐、广告预估、图象识别、语音识别等,我们真实的把大数据和人工智能算法在这些领域里面都有了非常成功的应用。

\

 
  智能风控的趋势

  大家一直认为大数据、人工智能的到来给我们带来的挑战也是非常巨大的。第一个挑战就是数据处理难度是非常大的。像传统的数据,它都是结构化数据,数据规整。但是现在的数据源是非常多元化的,而且有些是结构化的,有些是半结构化的,有的是非结构化的,所以这就决定了它的处理难度是非常大的。比如说为了处理一个数据源,就要建立一个模型团队,训练一个或几个机器学习模型去处理它,而它的结果仅仅是后面使用的一份数据而已,这是第一个方面。它比传统的从数据库里面读出来难度要大很多。第二个方面就是对数据的挖掘和建模的难度也会非常大。举个例子,如果说大数据的价值是传统结构化数据价值的10倍,那它带来的数据量的增长可能是一千倍、一万倍。所以它的价值密度非常低,虽然它有很大价值,但是要想挖掘出来,这个难度也是非常大的。
 
  无论是人工智能系统,还是大数据系统都给了我们更好的做这件事情的机会。
 
  第一,可以用一个更完整的风控流程来做风控。比如提交一些资料或获取一些资料。但当你用大数据、人工智能做风控的时候,风控的开始要远远早于这个人来申请这个信贷。也许这个人有手机并做第一个行为的时候,你的风险识别就开始了。这前面你会从设备维度、行为维度去识别他欺诈的风险,是不是专门用来专门做欺诈的,是不是在做自己的资质包装,是否在使用第三方的身份信息。通过一开始的欺诈识别先保证来的这个人确实是他。当他真正去申请的时候我们又会有一个完整的系统,这个时候这个系统会参考他申请之前的所有的行为,甚至是包括他在一些看起来无关的网站上登陆的一些行为,假如说一个人通过了四要素认证,首先他是他。其次这个人他的行为正常,操作时段的分布跟正常用户分布非常像,这时候基本上可以认为这个人是一个正常的人,不是专门做欺诈的人。因为专门做欺诈的人,很难把自己伪装的在各个方面都跟正常人一样。
 
  第二,如果他的工作生活比较稳定,那他的信用通常也是很好的。但是我不能直接看到这一点,但是我可以通过他的行为来看到这一点。比如一个人在工作时间段,他连接的Wifi是极其稳定的,长期都是这样子的,那基本上可以认为他的工作是相对稳定的。同样,如果他在非工作时间段,尤其是晚上9点之后,如果他连接的Wifi很稳定,那他的生活也很稳定,当然这只是一个维度。当你把很多维度结合起来的时候,通过相对复杂多级的模型,你会发现这个人的生活工作确实比较稳定,信用风险会更低,这是在信贷环节,在申请这个环节。如果这个环节拒绝,那就拒绝了。如果这个环节判定他是比较好的,可以根据级别来判定授信额度。
 
  基于大数据和人工智能我们需要用更完整的数据体系去做这件事情。比如,一个人在一家做信用贷款申请的时候,他可能从各个方面看起来都是很正常的。当前的手机号、身份证号都是很正常,但是如果你把它关联起来可能会发现,这个设备最近一个月还关联过另外两个手机号,而另外两个手机号在别的银行曾经申请是出现问题的,那么当前这个身份证号、手机号风险一下就加大了,这就是把全局数据打通的好处。比如说关联三个手机号、身份证号去三家进行信贷,这就风险很高了。
 
  大数据或者多维数据这种事情,它的价值密度是很低的。所以你要对它进行挖掘时,你需要更多维度更全面的策略体系去挖掘它。比如,会有一组模型,去看这个人的工作时间、非工作时间的行为稳定性,去看行为的多样性,有一些基于图的挖掘和图的模型去看他是欺诈团伙或者高危团体等。那么上面还会有可信度、欺诈风险、信用风险,再把底层的所有维度综合起来,再次拿到全局信息对这个人的风险状况进行评估。
 
  关于数美科技
 
  数美科技是一家大数据和人工智能公司,致力于为金融和互联网企业提供一站式反欺诈解决方案。目前服务客户破千家,覆盖金融、银行、直播、电商、社交、O2O、游戏等多个领域,数美希望通过技术持续创新,用科技、人工智能与大数据解决更多场景的欺诈问题,为客户提供可信、可依赖的优质服务。
 
  谢谢大家!
 


第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:lixiaojiao

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。