2010-10-22 10:14:00 来源:IT168
如果搁在几年前,有人问什么是列式数据库?可能不少人会很茫然。从1994年到2005年的十年时间,列式数据库几乎无人问津,而现在随着众多厂商加入到列式数据库的研发,且全球2000强公司越来越关注该领域,如今的列式数据库已经走出了阴霾,用户正在逐渐认可列式数据库,列式数据库的发展已成为必然的,。
从行到列的变化看起来微不足道,实际上意义深远。硅谷最优秀的技术大师之一、影响深远的商业书《跨越鸿沟》(Crossing the Chasm)一书的作者Moore认为,Sybase已经将经典的数据库行式架构模式“完全”改变为列式架构,提取数据的速度比传统数据库快100倍,而且支持与多人实时共享。“这是一种全新的模式,由此可以创造无限的市场机遇。”Moore特别强调了该产品的特点,“了解列式数据库对分析的含义。” 早在2001年,Geoffrey Moore就评价说:它们是最根本、最前沿的技术。
谈到列式数据库就不得不说列式数据库的鼻祖 Sybase,为此,IT168特别邀请到了Sybase (中国)有限公司技术总监卢东明,就列式数据库的昨天今天和明天进行探讨。
IT168:这次离我上次采访您已有1年的时间,在这1年中,Sybase发生了很多重大的变化,如,被SAP并购。Sybase被并购后公司发展战略是否有了变化?
卢东明:目前Sybase还是以独立子公司运营,在以后的时间里,Sybase会在移动商务、商务智能等领域会和Sap做整合,整合之后力图使Sybase列式数据库产生更多的应用,扩展Sybase产品的发展空间。
IT168:卢总曾经是我们ITPUB社区的版主,“卢山缘”这个ID相信不少Puber都有印象,卢总现在还会经常上ITPUB社区吗?
卢东明:现在我还经常上ITPUB社区,不过不用“卢山缘”这个ID了,我用另外一个号在ITPUB里发表一些看法,解决一些疑问。毕竟这样更能了解网友的一些更真实的想法。
IT168:今天我们的主题是列式数据库的昨天、今天和明天。请卢总给我们讲讲什么是列式数据库?列式数据库的原理是什么?与传统行式数据库相比又有哪些不同?
卢东明:行式数据库,数据按行来存储,虽然添加数据、查询数据较为方便,但现在的数据库应用有时需要做某些列的分析,行式数据库在查找这些列的信息时,由于其存取数据的特性,故其不能只读某列的信息,而需要把所有列的信息全部读取出来。这就使得查询效率大幅下降。虽然行式数据库也想到了索引 聚合表,但又带来了空间的暴涨。建立和维护索引也会浪费大量的资源和时间。
列式数据库,所有数据按列存放,例如把所有id放在一起,所有姓名放在一起。即查询时只会在需要的列上做IO,这就比行式数据库效率节省90%,此外,由于数据按列式存储,每列不论是数据类型还是特征都相似,这样数据库更容易对数据进行编码压缩,因此列式数据库在每列上还有非常专利的压缩算法。这是行式数据库无法实现的。
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。