2016年7月17日,以“大数据与人工智能”为主题的第五届中国大数据应用论坛在北京大学英杰交流中心成功举办。本次论坛由北京大学信息化与信息管理研究中心和中国新一代IT产业推进联盟主办,数美时代、章鱼大数据和北达软协办,CIO时代网承办。此次活动主要讨论了大数据与机器学习技术,以及这些技术在各个行业的应用。UCloud云计算资深专家王凯分享了题为《云计算助力大数据技术落地》的主题演讲,以下为演讲实录:
大家下午好!非常高兴有这样的机会能够跟各位专家做交流分享,我是来自于UCloud的王凯。首先要感谢本次活动主办方能够为UCloud公司安排这样一个主题。
大家都知道UCloud是一家专门从事云计算的公司,我们目前用到的云平台上已经有超过三万家的企业级用户。通过这些年的运营及实现过程当中发现,凡是在云计算平台上的企业客户,往往都会用大数据。通过我们的了解和学习也掌握了一个规律,凡是使用大数据的公司,分析服务的公司还是企业内部,都会用云计算平台发展这样那样的应用。今天我跟大家交流的内容是关于云计算助力大数据技术落地,我会分三个部分:第一部分,云计算和大数据天生具有哪些关系,我们提云计算的时候往往会提到大数据,提大数据的时候,比如陈总提出了云计算;第二部分,我们通过实际来看一下,云计算助力大数据技术落地;第三部分,工具及服务。
一开始陈院长在主持过程中就已经提到云计算和大数据的关系,包括刚才去哪儿网的唐总分享案例过程中,比如说公众旅游服务平台,这个是国家旅游局创办的一个项目,这个网站云计算都在UCloud云计算平台上,云计算和大数据确实有着非常紧密的关系。互联网技术发展在不同时期、阶段出现有哪些有代表性的产品及公司。像亚马逊、Google、雅虎这样的公司都是被我们大家熟知的,云计算和大数据这个产生的过程,大家知道云计算这个概念是在2007年最早由Google公司提出来的,当年Google发表了三篇论文,分别关于三个核心技术,其中有文件系统、算法MapReduce等。这三个技术是云计算平台核心的技术。我们说到大数据有一个非常代表性的产品就是Hadoop,Hadoop最早产生是由雅虎公司和阿帕奇基金会共同发起的一个开源项目,他有三个非常核心的技术,比如数据库HBase。我们看云计算和大数据这两个技术就可以看到,其实他们在产生的初期就互相包容和融合了。项目落地和过程中,这些相关的技术都是要用的到的。
云计算、大数据来自于互联网,会有海量用户,因此一定会产生海量数据。我们如何把这些数据有效的挖掘、有效的进行变现,这就需要有一个强大的数据分析挖掘平台。对于这些海量数据的存储、分析以及大数据工具的使用就要求底层基础设施非常强大,有很高的扩展能力和计算能力,这是云计算产生的需求。总结一句话,互联网、大数据、云计算是三维一体的,互相不可分割的。
从企业IT基础架构来说,大家是在平台层发挥自己的威力。而大家非常熟悉4V特点,比如说数据量比较大、类型繁多、实时性要求比较高。如果采用传统IT基础架构,你会发现很难满足大数据的需求和特点。那我们看一下云计算的特点,其实云计算平台五个特点恰好是很好的匹配到大数据,比如说云计算有非常强的存储资源池进行海量数据的存储,还有丰富多元化数据来源,按需计费的特点也非常适用于大数据的需求。我们有一些在云平台上提供数据服务的公司,当它有猎物、有项目的时候,在云平台可以部署一些结点、大数据平台,这个项目截止以后就把这个资源释放掉,非常节省成本。现在公司都要求轻资产运营,所以云计算的特点非常符合开展大数据业务的。从以上的内容就可以看到云计算和大数据绝对不是割裂的技术,两者是相辅相成的,是有依存关系存在的。
下面就通过具体的案例来给大家分享一下,看一下云计算和大数据这两个技术如何相配合实现技术落地。
先讲一个电商的场景,电商行业是把大数据这个技术应用的非常深入甚至非常极致。我们所熟知的,像淘宝、京东,这两年有一个比较典型的例子。淘宝支付宝发现了用户一个非常异样的行为,比如说某个时间段集中下载地方美食,这是非常奇怪的,从来没出现过。他的大数据团队非常敏感,知道有一些事情发生了,于是就发挥了大数据分析平台的强大功能,进行了关联性分析。发现其实是在这几天,中央电视台正在播出一个节目“舌尖上的中国”,我们的客户一边看节目一边流口水下单,这个就是一个非常典型的大数据分析的场景。运营团队非常快速进行了响应,马上推出了“舌尖上的淘宝”,推送给终端的消费者,让大家非常方便的获得到这些美食,这样也导致淘宝交易量有非常大的提升。
我们从IT架构角度来,架构跟一般的电商非常类似。首先,最里面是大的前端接入口,平台入口。中间是关系数据库的提取,再往后端就是数据仓库,也就是说进行大数据分析、关联查询、实时分析的一个平台。我们这个客户把所有系统全部部署在云上,这样做的好处是什么呢?我们知道电商平台现在交易量非常大,第二是促销等活动非常频繁,就导致了电商用户量、交易量是无法预测的。必须得要求前端入口有非常大的弹性。这块用到云平台上的特点,要有横向扩展的能力。客户在部署前端平台时会有一些项,设定一些规则和乏值,由专家组平台自动化的创建一个个结点,这样就会让前段扩展能力非常强大,保证终端客户流畅的客户体验。数据交易也全部用的云上的数据库产品,比如说我们提供了现成的主从数据库,客户非常方便的进行主从集群搭建。数据仓库也是使用了云化的产品,所以这里最大的价值是打通前端、中端、后端的数据交互通道,避免客户在传统IT上面部署抽取工具。
刚才陈院长在下午主持过程中也提到金融行业的大数据的需求,我们知道2013年是互联网金融元年,随着互联网技术引入到金融行业,我们把传统金融业务变的非常丰富。其中有两个特点非常鲜明,一是金融社交化,我们知道传统金融业务特点其实是是低频交易,进行转移、支付,就很难发生下一不交易。但是互联网金融不是这样,里面有很多社交化属性。第二是互联网金融公司全部转向科技金融,他们都是科技型公司。去年有一款产品是熟人借贷的场景,主要解决一个核心问题就是解决国内要账爱面子的问题。我们要账会发现非常痛苦,免于开口,怕影响到关心,这款产品就是为了解决这个问题。比如是我个人注册了,下载了App,他就推荐到我的通讯录,我也可以推荐给我的好友,推荐也有奖励。当我身边的朋友都使用这个平台的话,就都可以在这个平台上运作了。比如说我有一个借钱的需求,我可以发出一个需求,比如说我借10万,利息是6%。其中有个非常核心的概念叫单向运营,也就是说,我作为发起方,我的好友都知道我跟谁借钱,大家会评估我的信誉,是不是合适。这个时候就有朋友接单,但我不知是谁接的单,所以这就很好的解决了熟人之间赖账的困难。
我刚才举的例子里面有很多社交化的场景,比如说发红包。高频的交易对业务、对企业要求就非常高。在UCloud云平台上使用的客户,和刚才提到的熟人借贷公司,他们都是在一个平台之下。他有证券的理念,用滴滴打车的思维,同样也是打通我的好友,获取到通讯录,然后我可以把这款产品推荐给周围的好友,任何有证券从业资质的,都可以注册成为经纪人。这个平台给经纪人很高的回报,同时也引入了IM即时通讯,就把进入场景变的复杂。另外也包括投资咨询服务,他们有咨询团队实时观察股票交易情况,给客户进行股票的推荐。其实对大数据的要求是非常高的。反映到底层基础设施,对网络的要求是非常高的。那么我们知道互联网金融公司跟传统金融有个最大的特点就是首先它没有传统金融那么有钱。其次,还有一个非常大的困惑,面临着行业的监管,如何更好的配置资源、如何充分的满足要求,其实部署在云计算平台上是非常好的选择。UCloud数据中心在国内都是非常普通的,所以我们把前端全部署到云上。
建立跨中心的负载均衡,跨中心的数据库能够非常好的保护数据。由于同时受到证监会的监管,要求核心数据自主可控,它把这些非常核心的涉及到帐目,缴费部署在自己的IDC,这样极大的利用了资源,所以这是互联网金融在云平台上应用的场景。
智能硬件,我们知道对于传统的工业化硬件的监控,包括大数据分析是很早就有使用了。大家还记得,在前年2014年发生了一个比较悲惨的事件就是马航的事件,可能大家会注意到,有一些报告提到了,马航在飞行了多少小时之后就在雷达上消失了但是后续的报道又提到了一些信息,它的发动机又传回来一些数据,我们根据这些数据判断一下,后续飞行轨迹。为什么?因为工业化公司为了获取发动机分析时的状况以及跟环境因素的关系来看一下如何提高发动机的效率,把油耗降下来,所以发动机失效的同时还在往数据中心传数据。随着我们国家互联网这个行业的扶持和发展,这些场景也用到了个人的家庭环境中。比如说智能家电领域,它的业务逻辑就是智能家电安装一些传感器、发射器来跟数据中心进行实时的连接保持。终端客户通过手机APP也跟数据中心建立一个连接通道,获取智能硬件工作的状态,通过服务器来控制智能硬件的开关,比如说空调的温度调解、冰箱的温度调解等等。说到这就有一个非常强的需求,就是连接保持。
我们知道工业化这些硬件的连接保持是比较好预估的,因为我们知道多少设备、多少发动机是可以预测的,但是这些概念在消费者这个领域变的很难预估。那我们使用传统的架构,其实是很难满足这个业务场景需求。
满足在单位时间内由海量的小的数据包连接,是满足这样场景的。同样配置、同样CPU、同样内存配置的主机(音)大概是普通机型的3-5倍。客户使用这样的机型配以横向扩展的功能,非常好的满足了前端客户接入的需求。
传统金融,7月15号,银监会发了一个征求意见稿,其中提到了,在2020年要求银行业所有的互联网相关的业务全部上云,其他业务,包括核心业务上云的比例不低于60%。我们从云计算的角度来讲,其实一直在关注传统领域上云的进度。尤其是现在我们很多的传统银行、保险、券商也确实提到了商上云的需求,但是面临行业监管的不确定或者规则的模糊,所以全部上云有非常大的顾虑。同时它本身有非常夺得核心数据,认为放在云上不安全。对于这样的需求,我们给客户设计了一个混合云的方案。在UCloud落地的一个非常大的传统金融的客户,它的前端平都部署公有云上,过去获得的数据以及第三方数据先放在云的大数据环境里面做初步的筛选和分析,有价值的数据在核心托管到UCloud物理机上,这样既保证了前端的平台接入能力和扩展性,同时又保证了核心数据的自主可控,这样的架构也非常好的,满足了监管的要求。在银监会过了三级等保的认证。
以上几个例子给大家一起总结了一下,在我们的实践过程中,云计算和大数据是如何有效的配合进行技术落地。最后我想简单给大家介绍一下在云平台上有哪些现成的非常方便的大数据工具。我们知道AWS是云计算的一个行业标杆,很多公司都是以AWS为目标,在向他学习。UCloud有一个口号是要做成国内的AWS云计算公司,我做了一个对照,一边是AWS的大数据产品,一边是UCloud的大数据产品。其中里面的功能我就不追一一赘述。在刚才讲到的案例多少有提到,比如说关系数据库,MySQL的数据库,还有数据仓库,数据库和数据仓库云平台上都是免除客户维护等工作。对于NoSQL,我们有现成子产品,还有对象存储。同时这些海量的数据可以直接跟Hadoop平台进行内网的互通,方便我们使用。
进入到云计算和大数据这个时代,真正是进入到IT服务业的时代。在云上我们给客户提供非常好的咨询服务,同时免除了客户运维的工作量和烦恼,我们可以为客户提供7×24小时的在线的技术支持。最后就是希望今天参会的从事于大数据行业的专家能够跟我们UCloud云计算公司能多交流,我们争取能够在共同努力下获得更多的项目,为企业提供更好的服务,谢谢大家!
第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:ruanzh
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。