【北大CIO班十周年】唐会军:金融行业大数据应用

2015-12-04 10:53:48  来源:CIO时代网

摘要:2015年11月28-29日,备受关注的“北大CIO班十周年年会暨首届中国行业互联网大会”在北京大学与宽沟会议中心隆重举行。数美时代CEO、北大CIO同学会互联网分会秘书长唐会军,就主题“金融行业大数据应用”发表演讲。
关键词: 大数据 金融 北大CIO班
这些开放式架构,它都有两个非常显着的特点。第一,它的扩展性比较好,我认为有很多大数据平台,我认为它的核心,它有很多很多功能,但是我觉得它的最最核心一点是它的可扩展性,它的架构有很多问题,它的精准性,可靠性,有可能大家觉得步入商业发展。但是,就是因为可扩展性的优势,所以大行其道。
 
  第二个特点是什么,他们的架构就是便宜,省钱。这个对于很多场合创业的互联网公司在初期是非常有用的,正是由于开放式架构具备了高扩展性,而且成本很低廉。所以有一件事情变得很有可能或者说成本很低了,那就是存储更多潜在的低价值的数据。这些数据有可能在我们传统观点来看,在数据价值是很低的。远远不如我们一个帐号数据,一个帐号数据太高了,像这些低价值数据包括用户的行为数据,其实互联网里面存储最多的就是行为数据,他的业务一致,包括更长时间的历史数据,有可能以前因为成本问题和扩展性问题,很多重要的数据存了半年、一年我就不得不删掉。
 
  但是,正是因为开放式架构的采用,它扩展性好又便宜,企业就想,我又便宜扩展性好,很多数据我就存着呗,正是因为存着这些低价值的数据,可以让我们在很多大数据的场景应用中会有一些新的方式,原来不可能做的现在也可以开始考虑可能做了。所以后面我给大家简单分析一下金融行业有可能用更多低价值的数据做的一些简单案例。
 
  第一个,就是最典型,其实我都不愿意讲这个案例了,因为这个案例讲的太多了,运用太多了,但是还是不得不讲,为什么呢?因为对于一个企业来讲,让他知道大数据的价值,我觉得精准营销是一个很好的切入点,很容易让老大看到这个价值。为什么呢?像什么包括新用户的获取,老用户的留存,老用户的二次挖掘,睡眠用户的唤醒,这些事情做好了,那我公司的老大绝对是实现他的价值,所以,这个精准营销是很多公司想切入大数据领域,或者想做一些大数据领域的事情的时候,我觉得是一个非常好的切入点。而实际上他做好的话价值也很大,真正在很大的互联网公司里面,营销层面做事情就太多了。
 
  像百度搜索这个我理解就是很好的典型。所以广告其实考虑很多纬度,你个人的习惯、爱好什么什么的,等等都会考虑到,每个人输同一个关键字出来广告是一样的?不是,而这些精准营销在新时代情况下,一般都是依托于数据画像,为什么呢,因为你的用户很多,你真正了解你的用户,你不能靠我们。传统银行就是大数据的贷款,有可能获得大客户,高价值客户因为它的数量比较少,多设一些客服经理什么的有可能做的很好。但是其实真正你的用户往下沉的时候你的用户数量极大的扩张,这个时候从人的方式就很难理解客户。
 
  所以,通过用户画像,而就是在前面,用户的行为越来越互联网化以后,然后企业就存了很多用户行为数据,所以用户的画像也有。
 
  精准营销是一个非常好的领域,可以做很多很多事情。
 
  第二个是金融行业比较相关的,就是风控。其实风控是一个非常重要的领域,而且风控的好坏是会直接影响到企业的盈利水准,水平。像交易欺诈,像个人征信,其实像征信评估现在是很火。我们知道的专门第三方做征信的公司,非常多。但是现在第三方做征信的公司我觉得普遍面临一个问题效果不是特别好,在什么地方,它具备的到价值的征信的数据表现,这个是很多目前做第三方个人征信的公司面临一大问题。因为它就是拿到的真实有效而且快速更新的数据,看的特别少,反而我认为自己具备大量用户信息金融机构他自己做征信是有先天优势的,因为这个数据必须得有数据。
 
  大量的金融机构有大量的用户数据在里面,而且这些数据都很真实,所以用它做是天经地义的,你可以初期一定要立足于自身的数据为主,把自身的数据的价值挖掘到极致以后,再去补充一下外部的数据,而不是依托于外部数据,因为外部数据的真实性和你业务的匹配程度都是很难保证的。
 
  包括企业贷款风险评估,其实企业贷款风险评估,在国外是很成熟的这个模式。但是在国内其实企业贷款信息风险评估,我所了解到的做的不是那么好,其实也是面临同样的问题。就是你能获取到的真实有效的企业的信息,比较有限,这也是中国信息化做的,信息化的整个进程里面没有完成导致的一个结果。
 
  像反洗钱这些金融业务我知道央行很多金融机构定期下发很多规则,然后去发现一些反洗钱的案例或者记录,这个规则怎么来的,其实就是用大数据的分数去挖掘。保险,保险也是一个很重要的大数据的,我今天开车的时候,每次保险的时候,保险的客服人员说你去年出了几次险,所以今年打几折,我想这个也太简单粗暴了,就是简单的以去年出了几次险就打几次折,但是我相信这个五年,十年,保险公司再给我打电话就不会这样说了,为什么,因为车联网越来越火,车上装APP模块就可以收集这个车方面的信息,一年用了多少时间的驾驶,多长时间在开长途,你驾驶习惯怎么样,等等这些信息都收集以后,这些模型,我觉得这个是给你去定义一些打折的折扣我觉得这个精准性一定是远远大于简单的靠出险的这么粗暴的一个规则。
 
  同时,你这个模型做好,在两个公司竞争的时候,像我这种驾驶习惯比较肉的人,即使我也出一次险,另外一个驾驶习惯比较激进的人也是出一次险,但是我觉得给我一个大的折扣才合理是吧。
 
  传统的就不用说了,国外的一些创业性公司,现在也在逐步进入这个领域,看到这个领域的前景。
 
  精准营销和风控,是两大类金融行业将来有很大的价值的领域。下面说的就是最近比较新的一个领域,当然国外这个可能也不新了,就是高频交易。最近股灾以后,高频交易被大家提及的次数和频率大大提升了。最近听到一个事,有两个俄罗人,然后用680万的本金,然后做到了20个亿。然后他们就做了一个事,这两个俄罗斯人,他们做的就是一个事,就做高频交易。在不到两年的时间,680万的本金做到20亿,这简直就是难以置信,这不是小道消息,大家去搜新闻都能搜到。
 
  当然,结果是很不幸,结果是这个公司被查了,可能他的高频策略做的有点违规。但是,高频交易在国外是一个很成熟的模式,像美国股市很早大家就知道,美国股市那么大的成交量里面有60%左右都是靠程序交易而不是靠人,而且国外即使70%里面靠人交易而是大量靠机构而不是靠散户。所以,我总在想,原来是大机构,基金来收割这些散户,像割韭菜一样一茬一茬,很不幸,这次股灾我也进去被他割了一茬了。当高频,交易出来以后,我觉得这个割韭菜的人就更多了,所以我对自己一直在反思和总结的时候我说,哎呀,我不能再当韭菜被大家再割一茬了,所以我觉得散户还是不要再碰为妙。
 
  但是前面由于时间关系,我简单列举了几个案例,然后后面简单看一下面对的一些挑战。第一,我觉得金融行业在三大领域可以做很多事情,这个面临很大的问题是因为传统的IV系统还是主流,大量的数据还是分散在不同的系统里面去,这些数据的收集和共享尤其我觉得很多金融行业应该做的,但是做的程度还不够。如果哪一天这些数据,绝大部分的数据都在共享平台上的话,我觉得很多事情都是可以开展的。
 
  第二个,我刚才前面提到,开放式大数据架构银行都在采用,目前银行的规模还很有限,现在我知道好多的机器也就是在几十台的规模,远远没有到几千上万台的规模。数据是流程创新,因为我们最近在跟很多行业合作,发现要走很复杂的上线流程,测试流程,因为数据挖掘很多是试错性质的,看一看,走一个复杂流程的话,可能这个迭代效应就受影响。最后是规划和迭代,然后这个其实大家知道互联网公司里面是重迭代,轻规划,但是我后来发现在很多传统行业里面是花大量时间在规划,而不是在迭代,所以我觉得这个可能是将来传统行业或者金融行业面临的一些挑战。做大数据的很多东西都是试错,试一下,试一下。每一次试错都是需要很多流程的,这个周期太长了,会影响迭代的速度和试错的信心,谢谢大家。

第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:唐会军

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。