首页 > 大数据 > 正文

大型数据库开启效率之旅

2012-09-20 09:57:59  来源:CIO时代网

摘要:许多企业基于历史发展的原因,还会创建多个数据库。它们经常采用不同的平台,使用不同的软件,造成了数据处理和管理效率的低下。
关键词: 大数据 数据库

    大型数据库开启效率之旅


    许多企业基于历史发展的原因,还会创建多个数据库。它们经常采用不同的平台,使用不同的软件,造成了数据处理和管理效率的低下。


    这些数据库通常包含与其它数据库相重复的数据。一个数据库一般不会将另一个数据库作为数据源。这样就会消耗额外的磁盘存储,增加重复数据迁移所需要的网络带宽,也会因从多个数据存储获取相同数据的需要而额外增加服务器CPU处理的负荷。


    同时,假如企业拥有多个数据库的话,那么他们通常会将它们部署在不同的平台上,针对不同的硬件平台采用不同的维护方法。这样需要维护不同品牌和模型的服务器数量越多,成本就越高。如果是关键任务服务器,那么提供冗余性的硬件就会重复,这也会增加额外的成本。


    此外,企业还不得不面对运营效率低下的问题。假如在多个服务器上运行多个数据库系统,那么有一些运营成本需要考虑,包括培训多个系统的人员、监控多个系统、修复多个平台的故障、修补和更新多个系统。而在统一的操作系统和硬件平台上运行一个系统会更简单一些,成本也更低。另外,监控和故障修复也更加简单。


    在一些情况中,数据规模直接决定了系统规模。大容量数据需要组织起来进行处理才会产生价值。如果将整个企业的信息整合为一个统一且安全的整体,那么许多企业都将获益更多。因而虽然单个大型数据库系统的初始成本高于一般数据库,但是对于长期运营而言,更加划算。而且单个数据库系统可以根据当前需求调整规模,在有需要时增加容量,从而使整个系统处于高效率的运行状态。

[page]    值得一提的是,近年来许多数据库厂商大力发展的内存计算技术,同样对数据处理速度的提升起到了很大的作用。


    内存计算的主要用途之一是庞大的数据集的实时操作。在传统的数据库中,数据存在硬盘上。数据和服务器的CPU,通过有线连接,所以数据要到达的“桌面”是缓慢和遥远的,当需要十亿字节或者艾字节的数据时,数据库性能缓慢的主要原因之一是数据存取的时间过长,不能以足够快的速度到达所需要的地方。


    在内存计算中,数据就存储在CPU的旁边,可以瞬间到达。这意味着数百GB的数据分析,报告和预测需要几秒钟内就可以完成,而不是几小时。


    行业掘金性能为王


    大型数据库和内存计算分别在应用模式和技术上为提升大数据的处理效率作好了准备,但无论是大型数据库还是内存计算,都需要服务器主机具有强大的计算能力、大容量的内存和足够的存储空间,并且将这三者集于一身。而归根结底,就是服务器主机必须具备强大的性能,才能满足高效处理大数据的需要。


    结合电信、金融等行业的应用发展,伴随着这些行业的数据向省级集中,更大容量的数据库和更高性能的服务器主机,成为应对大规模用户集中访问数据的基础。


第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:fanwei

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。