专访港科大教授张晓泉:目前大多传统金融机构应用AI有些片面

2017-08-01 09:56:24  来源:AI掘金志

摘要:“人机回圈”(Human in the loop)是人工智能圈的高频词汇。简单地说,就是将个人(专家)或公众群体的判断,融入AI系统的优化中去。
关键词: 金融
  “人机回圈”(Human in the loop)是人工智能圈的高频词汇。简单地说,就是将个人(专家)或公众群体的判断,融入AI系统的优化中去。这个闭环回路在AlphaGo上展现得淋漓尽致,它之所以能横扫AI和人类对手,与背后包括欧洲围棋冠军樊麾在内的专业棋手团的磋磨分不开。
 
  “在这个过程中,人类其实是在陪机器下棋,机器在逐渐获得人类的知识技能。人类相当于labor,很被动。”
 
  在近期由中国计算机学会(CCF)主办,雷锋网和香港中文大学(深圳)承办的第二届CCF-GAIR全球人工智能与机器人峰会上,张晓泉教授分享了这番观点。
 
\
 
  张晓泉现任香港科技大学资讯、商业统计及运营学系教授,此前求学于美国麻省理工学院、清华大学,分别获得管理学博士和管理学硕士学位。他目前的主要研究方向是商业人工智能、互联网金融、信息产品定价策略及大数据营销。学术论文曾发表在《美国经济评论》、《管理科学》等知名学术期刊。目前他还是学术期刊 Information Systems Research(信息系统研究)的高级主编。
 
  人工智能是近年来的明星技术,各行业都纷纷对其敞开怀抱。其中,金融行业对于AI的研究和应用无疑走在前列。作为一位经济学家,张晓泉教授对于人工智能也颇有见地。立足于其研究视角,他指出,经济学有助于优化AI在金融领域的应用。他进一步解释说,
 
  目前人工智能更多是用于预测和分类,而经济学家的研究重心是找到因果关系,解释清楚事情的底层机制。这也是计算机学家与经济学家看待科技创新的一大差异。
 
  双方视角之差,犹如地心说与进化论的不同。地心说能够预测太阳明天会升起,但却无法解释背后的原理,因为理论根本是错误的。进化论却相反,它能解释人的由来和进化史,却无法预测人类未来会是什么样。张晓泉教授认为,行业如今的首要目标就是结合两种研究思维,这也是他目前的研究目标。
 
  “除了‘Human in the loop’,我觉得应该也有‘Econ in the loop’。过去20年,经济学家建立了众多数据分析模型,包括整套的计量经济分析框架。若能将这些模型与人工智能相结合,会产生很多有趣的结果。”
 
  Fintech前沿研究
 
  股票情感分析
 
  在股票投资领域,高卖低买一向是投资者的梦寐之求,但绝大多数情况只是黄粱美梦而已。虽然人们无法准确预测股价,但在不断向这个目标靠近。据了解,上世纪70年代,投资领域就开始广泛应用计算机。世界最大的两家资产管理公司黑石与领航都是完全采用量化投资方式。而近年来互联网、移动互联网、云计算、大数据、人工智能等技术的发展,为股票投资带来了更多新可能。
 
  张晓泉教授就有不少围绕股票开展的研究课题。与人工智能相关的一个项目是利用深度学习进行股票情感分析。他的团队利用工具爬虫,全网抓取新闻媒体、散户论坛、微博等文本信息,收集后将其与该公司的金融信息做对比,建立一个模型。
 
  据张晓泉教授介绍,该模型与其他模型的不同之处在于,其他模型从语义分析出发,仅是收集汇总文本含义。而他们的重点是,会进一步获取词汇与股票表现之间的关系,发现每个词在当时起到了什么作用。那么在未来,模型可以进行一些简单预测,发现众人的关注焦点,以及宏观层面的行业轮动。
 
  模糊性研究
 
  高风险、高收益是金融行业的永恒标签,股票投资也与风险息息相关。股票市场的传统风控就是研究股票波动率。业内存在一种观点是,可以用人工智能解决所有的风险管理问题。而张晓泉教授对雷锋网表示,该观点是错误的。
 
  “ 风险有多种层次,而且一旦写出波动率,底层就一定假设了某种概率分布,但是很多时候,我们无法获知金融事件的概率分布。例如股票市场。”
 
\
  图1 风险五级别
 
  这里需要先介绍下张教授提出的不确定性的五个级别。
 
  第一层是 Certainty,意味着 100% 会实现。
 
  第二层是 Risk ,即有概率会发生。世界上的大部分问题都处在这个级别,但股票市场就不属于。
 
  第三层是 Black Swan 黑天鹅,也就是小概率事件。
 
  第四层是 Ambiguity 模糊性。“明天的股市不是涨就是跌,但是涨跌的比重没人知道。即便我们有过去世界所有股市的数据,但仍不知道明天是涨还是跌,因为有太多影响因素。”
 
  第五层是 Radical Uncertainty,“ 人们不能描述出 Radica Uncertainty ,也完全无法解决这个级别问题。就好像人无法写一个模型来预测恐怖袭击会在何时、何地、如何发生一样”。
 
  张晓泉教授表示,模糊性是一个比较前沿的研究,结合“Risk”有助于人们加深对风险的理解。举个例子,下图是美国股市从1968年到2016年的波动率,即股票市场的风险“Risk"。
 
\
  图2 1968—2016年美国股市风险
 
  如果用传统的方法——标准差去描述,看到几个现象:第一风险高点出现在1987年10月19日美国股灾。第二个高峰出现2002年,当时正值互联网泡沫破裂。再往后2007、2008年次贷危机攀上新高峰。
 
  “最近我和同事在做模糊性预测模型,我们发现模糊性最高的是1987年股灾,而2002年科技泡沫时期模糊性并没有那么高。我们得出的结论是,2002年的互联网泡沫不是一个真正的大泡沫,背后蕴含着技术对于未来的影响力。”
 
  他总结说,经济学的愿景就是希望用模糊性去描述“Risk”没法解决的问题,他们为市场提供了模糊性新指标来衡量股票风险。
 
  从研究到应用,两大跨界趋势
 
  学术研究的目标在于找寻新风景,接下来的产业应用则会偏重于实地探测,挖掘金矿。除了学术经历,张晓泉教授此前也从事过投行分析师、科技公司国际市场部经理等职,还创办过一家互联网企业。他表示,从研究到应用过程中,存在两大跨界趋势。
 
  学术界与产业界交融
 
  第一,学术界和产业界融合愈加紧密。
 
  “我认为导致变化的主要原因是当时大数据尚未普及,计算能力不够。如今展现了一个非常好的趋势,科学家可能会在公司中任职,或者自己创业,这样能使得一些新的研究成果立刻付诸实践。另外,学术研究人员通常会拥有一种更长远、改变行业规则的心态,这能中和企业短期追求。”
 
  张晓泉教授评价道。
 
  “与此同时,也解决了学术圈长久以来存在的最大问题——资源有限,如数据资源有限,配备设施有限。而企业的出发点是商业化,只要有利于盈利,它们就会为研究提供资源。这样就形成了良性循环。”
 
  当然,在双方合作落地的过程还存在一些问题,赵晓泉教授指出,其中一大基础矛盾就是学术界和产业界追求存在差异。科学家致力于最前沿的突破,研究如何将准确率95%提升到96%等问题。而企业追求解决问题,产生效用。提升1%,算法速度提升一秒等发现对于他们来说,意义可能并不是那么重大。当绝对值很小的时候,顶尖的研究对于行业的影响较微弱。这要求着学术界、产业界更进一步的沟通理解。
 
  金融与科技的跨界合作
 
  第二个趋势是,金融界与科技界的跨界合作正在接连上演。几乎任何一家金融机构都会设立金融科技部门,很多科技公司也开始涉足金融业务,“Fin”与“Tech”的合流之势不断明朗。
 
  例如,今年六月,国内银行扎堆宣布与科技巨头联姻。当时,张晓泉教授就对雷锋网表达了他的看法,
 
  “公司的存在就是为了提高效率,技术(包括商业大数据、AI)也是为了让工作更有效率,因此这样的合作更早的时候就可以开始了。未来的公司都不需要打标签,没有技术和金融之分,只是用技术来解决各行业的问题。”
 
  与学术界与产业界需增进了解相同,fintech的发展也要求着“银行家”与“工程师”扩大交集。尤其是作为一门应用科学的股票投资。张晓泉教授举例道,一些AI专家写出的预测股票模型在实验室环境下准确率能达到80%,但是由于缺乏对金融市场的理解,真正下场的表现惨不忍睹。他的团队也有做相关预测模型,准确率在75%左右,实际表现也很稳定。
 
  而随着近年来fintech行业的成熟,科技开始触碰到金融真正的核心。一些新技术及产品如雨后春笋涌现,其中以区块链、智能投顾最引人注目。
 
  在张晓泉教授看来,目前智能投顾行业最大的问题是太拥挤了,门槛不高,从业者甚多。
 
  “这个市场发展到最后应该是一家独大。现在的智能投顾仍处于跑马圈地阶段,类似于早期互联网时代出现了数不胜数的搜索引擎。当时没人知道哪家会赢,现在也是如此。”
 
  至于区块链,他表达了对其前景的看好。虽然如今还处于早期阶段,业界还在解决一些最基本的技术问题。同时,他也指出,区块链最大的挑战在于没有形成一个很好的商业模式。技术人才缺乏商业认知,有商业背景的人缺乏对于技术的深刻理解。
 
  新技术的发展必然会对行业以及整个社会产生冲击。在实际应用中,监管是个绕不过去的话题。张晓泉教授在最后也谈到了这方面的观点。
 
  “新技术及相关产业的发展犹如大浪淘沙,在推动行业从业者尝试,磨合出商业模式的同时,还会对传统社会的理念、机制造成改变。比如法律法规。从前土地所有制在飞机出现后就不再适用,不然每一次飞行都侵犯了持有者的所有权。当技术导致大环境变化时,法律法规需要进行修正。”

第三十四届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:pingxiaoli

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。