2015-04-17 11:48:57 来源:CIO时代网
2015年月11日,由北京大学信息化与信息管理研究中心、中国新一代IT产业推进联盟、北大CIO同学会教育科研分会主办,CIO时代网、北龙泽达承办的“新一代IT与教育科研信息化研讨会”在北京中科院计算机网络信息中心顺利举行,来自教育行业的专家学者共同探讨“十三五”信息化规划与新IT时代的教育信息化发展趋势。
北龙泽达总经理甘宁在会议现场为大家分享了《大数据服务-数据云的产业化》的主题报告,他首先为大家介绍了泽达数据的相关概况,并重点阐述了泽达为中科院提供的服务,其中包括安全的云服务、卓越的网络环境、独有的长期归档等等。他还与嘉宾们分享了未来中科泽云开放的云平台愿景以及基于云的大数据服务框架。最后他分析了泽达的重点客户案例,他们也将不断引领食品安全的大数据趋势。以下为演讲实录。
北龙泽达总经理 甘宁
首先作为半个地主,欢迎各位的到来,同时也感谢北大的CIO活动提供这么一次机会。
看到这个题目,各位应该有所了解,作为数据云的服务,其实关键在数据、云和服务这三个词上。在前面王伟研究员的报告当中已经介绍到了,我们做“十二五”规划的时候,虽然当时没有提到大数据,但是一直留了一个数据的维度,就是科学。当时数据密集型科研作为第四个方式提得很多,在科学里面,数据这个维度,在科学院体系内一直留着。到了后来,由科学数据库和六个工程中间数据的汇集和共享的工程,提出一个数据云的概念。其实,它是一种服务,以云的方式承载科学数据共享,来给整个科研信息化中间的数据之间服务,其实就是一种大数据服务。
由此,后来我们发现,通过产业化的方式去推广这个服务,对提升资源的利用率,以及提高服务的响应程度会更好一些。因此,后来产生了产业化的思路,并且获得了国家发改委以及北京市发改委相关在大数据应用技术工程实验室的支持。以及后来在2012年到2013年,成立了一家专门的数据公司。定位就是以中科院计算机网络信息中心、科学数据中心在数据中心的能力,以数据的维度看世界。这个和前面几位老师讲的维度不一样,本身我们产业化的方向是从数据的维度看这个事情,这个应该算是国内比较早的。
当时我们从数据的维度看,在科研、政府和国有企业,有一定安全需求,并且倡导国产化和自主可控的领域,在私有云和混合云,甚至这种混合云是专有的,以及他的数据,数据的安全,数据的可视化分析方面的服务。当时我们产业化的服务方向就定义成云和数据。
在成立的时候,网络中心整个把基础设施、相关的资源也做了一些整合,这两年下来,我们在政府,以及政府相关比较关注的民生领域取得了比较大的突破,另外就是我们自己的科研院所。当然了,现在的数据,刚才前面几位老师也提到,国内的数据,到底大数据是不是提得非常合适,确实存在争论。但是至少有一点,泽达数据尝试给国际应用管理机构做数据托管,它是一个独立的,有商业链条的数据托管的服务,它是从数据的维度,真正的实现了一条商业链条,什么商业链条呢?它的逻辑,我的数据,我的运营的数据凭什么给全世界使用运营的人保证它是永续的?一定是要存在我认可的第三方的机构,在这种模式情况下,他是由商业保险和法律体系约束相关整个产业链当中的参与者,产学研商政各个环节全部在这个体系内。这也给了我们很大的启示,就是给国产化可控安全需要的客户,通过提供这样的服务,来完善这样的商业模式的探索。
为了做这样的工作,首先我们推出了一些安全的云服务,因为它是数据维度看这个世界的载体,现在发展的结果,我们认为数字化的结果是数据化,数字化是一个过程,它带来的结果就是全部都是数据,不光只是科研是如此。泽达有一个优势,不管是什么样的技术架构,战略中科院以及十二个分院,以及科学数据库所承载的数据云的基础之上,我们推出了私有云、专有云去面向所有的客户,包括和我们做应用的各个合作公司,在做这个事情上,把所有的一切都在向服务的方向去转。
现在在转的过程当中,我们有一些争议,从科研转到产业化服务,其实面临的挑战是很大的。首先第一是工程性的挑战,网络中心和计算所、软件所相比,我认为在整个中科院体系里面是偏工程性的,纯研究性的方案上相对弱的。这在产业化过程当中,反而是一个优势,为什么呢?因为产业化就是提供服务,这个服务和商业服务到底有什么区别,能不能达到商业服务的水准?不管是用户也好,客户也好,都在乎这件事情。其实就是先做2B还是2C的事情,其实有很多喜闻乐见的服务是针对个人的,有很多大家不为人知的环节是针对企业级市场的。
前面几位老师讲到EA架构,企业级市场有一个最基本的要求,你提供的服务一是要够用,二是稳定的,这是和针对个人市场的,以抓住痛点,快速迭代的,有一些本质的区别。因为企业一般来讲做事情的时候,总是要设立相应的规则和相应的底线。作为工具也好,支撑也好,战略也好,他所要提供的服务,一定有一定延续性的要求。其中我们也出了一些服务,白色字体是专有云的服务类型的,黑色字体的是实体的产品。比如说这个zeStack ,实际上是现在整个在科研院所里面部署最多的云平台,应该是科研所占有率第一的,我统计了一下,截止到今年,已经超过20家科研院所部署了这个作为他的私有云平台,整个市场占有率应该是超过20%。OpenStack其实我们做的工作不多,很少,一是解决它的稳定性,二是把它直接打到课题组去用,直接让课题组的老师愿意去用。其实就是解决用户和客户折中的问题。
我们做这个服务的时候,利用勒柯吉网的网络带宽,刚才在王伟研究员的报告当中也看到了,网络接入是很重要的,尤其是现在服务数据量这么大的情况下。另外把科学数据库独有的长期归档,中国科学院计算机网络信息中心在怀柔的基础设施,也作为一个重要的设施,其中比较有特色的是我们把一个10PT的磁带库现在也放在云服务里面。但是,现在这些服务目前不是针对个人开放的,主要是针对,至少是一个企业级的市场,针对课题组一级的。
下一步我们希望在云的方面做到什么程度呢?把这些基础设施,基本上标准化,服务化,主要的目标对象还是政府、国企和大企业,这个云其实是一个以私有云、专有云的服务为主的,强调安全、自主、可控的云服务。目前来说,如果是需要,针对第三方我们也发展了很多合作伙伴,在这个云平台上直接开发针对个人类的应用。在这个云平台上,其实做得最多的是帮助用户去把内部外部的数据融合起来,在这个平台上做各类应用,最后通过可视化的工具去做展示。而且我们还开发了一个展示平台,但是很遗憾,这个电脑不能上网,今天不能演示。
现在在数据云的融合,包括大数据分析的模型上,我们现在都是通过专有或者私有云两种服务输出。这是国家发改委支持我们做到的,目前在工具层面,以及初期转换,还有大的面向主题的仓库,以及最后的图形化,建立了一个工作平台。目前这一块儿,当时六大领域,包括物理、天文、虚拟天文台,很多事情都已经支撑在上面了。
这是数据本身针对民生热点,就是食品安全的数据领域,把互联网的舆情数据,还有食品安全信息中心的业务数据,以及其他微信、微博各种各样的数据,还有实验室的检测数据,通过这样一个安全的云,和政府机关内部的私有云上的数据结合做的大数据分析,支撑了很多实际的案例和应用。当前在大数据方面,主要是基于云,还有数据的服务,还有功能实验室和应用示范方面的服务来提供给相关的政府行业。
从案例上来讲,我简单的举几个例子,目前产业化服务的情况。事实上做了产业化服务之后,我们现在和体系内的信息化机构打交道反而相对少一些了,我们接触到政府各方面关于信息中心的主任,就是CIO比较多一些。从很多实际的情况来看,在整体架构上的设计、调整,有时候受制于管理和政策,有时候政府要做很多工作很难,我们以去年的一个比较经典的例子,北京市地税局来说,他其实面临着行政的压力,必须在规定时间内完成规定动作,就是把高能耗,非常耗钱的交流中心快速的裁退掉。他面临几种选择,一个是自建自维,或者是使用经信委既有的,也可以采购第三方的服务,他最终选择了采购第三方的服务,主要是从总体的运维成本来考虑,另外是从服务提升的角度来考虑。
其实提到的要求非常简单,主要是四条,其中最核心的是SLA的指标。这个事情让做到什么程度呢?通过这样一个安全的专有云,给他提供了一个通用的基础设施,最后优化出来,其实是计算能力,第二是和应用的结合能力,第三是安全,第四是服务响应,通过这四个方面最终凸显出来这个服务的优势,非常快,政府从提出这个事情到最后决策,半年之内就全部解决完毕。到今天,截止到今年3月31号,所有各位年收入12万以上的报税系统,都是在这上面完成的,大家记住这已经不是小型机了,完全是在云X86,所有的是基于专有云的架构把它完成的。
我觉得有几点可以证明的事情,新的时期真的会倒逼,他原来的全是IBM小型机,这一次全部是X86,其实用户自己是没有感觉的,他自己实测这边的处理能力比原来的要强。第二是成本,这个成本包括两方面的成本,一方面是传统讲的TCU,另一方面,其实有一个没有算出来的,是时间成本,这个时间也包含一定的人力成本。其实现在很多CIO都已经意识到了,数据和云的服务方面,如果想彻底颠覆掉原来人才队伍的能力,重新投入学习的话是非常难的事情,采购服务是最好的选择。所有的信息化队伍经过这20年的建设和发展,已经形成了非常固定的知识体系结构和能力,而且有非常强大的惯性的,不管合理不合理的体制,执行的是非常强势的过程。现在在面临IT和本行业信息化深度结合的时候,现在提互联网+,重点应该是在+这个事情上,前面李老师他们也都提到,包括我的同事王伟也提到,信息化更深入的要跟业务结合,虽然我们常常说诺基亚提的口号是对的,以人为本,但是提得太早了,所以过早的就挂了,现在真正的是以人为本。
要去做这个事情,我觉得最好的方式,特别是在企业级市场,可能讨好用户是最终的出路,但是当前折中的路线是客户和用户之间要达到一个平衡,这是我们产业化思路的一个节点。现阶段讨好用户活不下去,只讨好客户,这种方式也走不通了,因为互联网倒退的特别厉害,各行各业,还包括科研信息化,如果要执行+的策略的话,确实是有很多办法的,至少在通用的,偏基础性的地方,采购服务的思路,应该会纳入到企业整体的IT治理里面去考虑这个事情。而且,现在缺的是什么呢?对服务的考量和评估,是不是真的会比原来的方式好。
其实我特别提到第二个案例,现在泽达是整个ICANN在亚太地区最大的数据托管机构,这个数据托管,它是纯粹从数据的维度来看这个世界,对我们的启发在哪儿呢?有一个很现实的问题,今天不管是谁,即使是科学院,或者说是亚马逊,阿里,盛大,我们大家把IT系统放上去,大家扪心自问想一想,这个世界上没有永不倒的公司,如果给大家提供云服务的这家公司倒闭了怎么办?其实我理解ICANN的数据托管,所有我的。CN、。COE、。ORG这些域名的运营机构、注册机构不会永存,倒闭了怎么办?其实这个启示一直在产业化的思路当中,对科研信息化来说,为什么现在会有私有云呢?当然有多种考虑。为什么不信任公有云呢?也有安全的因素。但是归根到底,在这样一个服务的时代,我认为信任或者信用是第一位的,信任是这个生意的前提,如果不构建一个完整的闭环的话,这个事情是很难永续发展的。解决这个事情有一个维度,我认为是数据的维度,今后一定会有一个机构去评价所有的云服务机构的业务连续性,至少评价机构有一个标准,这个云服务机构倒闭了,所有的用户数据是回得来的。大家希望能够在产业化当中下一步,不管是在哪一个信息化的领域去解决这样一些问题,当然这是一个针对企业级市场的事情。
现在我们在大数据方面的进展其实挺多的,刚才讲的食品安全,因为食品安全是一个热点,最近是信息惠民,非常多,现在我们主要是服务于监管单位,未来下一步可能会在这一块儿服务于更多的企业,甚至未来会推出一些更多的,针对个人的服务。本来是有一个H7N9大数据方向的展示,今天这个电脑没有网络我就不展示了,有时间的话,欢迎各位光临我们数据中心,有时间咱们再交流,谢谢!
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。