首页 > 大数据 > 正文

数据库风云变迁 未来谁主沉浮

2008-12-22 09:20:20  来源:计世网

摘要:我们也不能否认,在关系型数据库出现之前,网状数据库对于层次型和非层次型结构数据都能比较自然的模拟这一优势还是非常突出的。因此,IDS在数据库的发展史上还是占据了相当重要的
关键词: 数据库 信息化

    25年前,也就是在1983年,IBM推出了第一款面向大型企业的商业化关系型数据库DB2。当时的DB2是以在此13年前IBM研究员E.F.Codd提出的“关系模型”为理论基础的关系型数据库。在当年很长一段时间,关系型数据库主导了整个数据库市场,IBM院士王云甚至开玩笑地说:“如果当年IBM没有发明‘关系模型’,或者说IBM为此申请了专利,那么也许就不会有今天的甲骨文了。”

    错失关系型数据库的统治时代

    事实上,数据库的历史可以追溯到50多年前,那时的数据管理还非常简单。“通过大量的分类、比较和表格的绘制,在机器上运行的数百万穿孔卡片完成对数据的处理,其运行结果在纸上打印出来或是制成新的穿孔卡片,数据管理就是对所有这些穿孔卡片进行物理的储存和处理。”IBM院士王云介绍说。

    “1956年,IBM生产出了第一个磁盘驱动器——Model 305 RAMAC,该驱动器有50个盘片,每个盘片的直径是2英尺,可以储存5MB的数据。”王云介绍说。在当时,磁盘所带来的最大好处就是可以随机存取数据,而穿孔卡片和磁带就只能顺序地存取数据。可以说,随机存取对于数据管理的发展是一次具有革命性意义的改变。

    此后,通用电气公司研发出了最早版本的数据库IDS(Integrated DataStore),这是世界上第一个网状数据库管理系统。不过,IDS只能运行在通用电气的主机上,而其更大的问题是数据库只有一个文件,所有的表都必须通过手工编码生成。正因如此,几年后IBM开发的层次型数据库IMS(Information Management System)成为了当时最典型的数据库管理系统。

    当然,我们也不能否认,在关系型数据库出现之前,网状数据库对于层次型和非层次型结构数据都能比较自然的模拟这一优势还是非常突出的。因此,IDS在数据库的发展史上还是占据了相当重要的地位。

    在上个世纪70年代初期,虽然网状数据库和层次型数据库已经可以很好地解决数据集中和共享的问题,但是其在数据独立性和抽象级别上依然还存在着很大的欠缺。用户在对这两种数据库进行存取时,仍然需要明确数据的存储结构,并指出存取路径。

    “尤其在那个时候,用户对于该如何让业务应用得到更好的开发,以及如何让数据库与操作系统之间实现更好的结合等问题已经开始有了越来越迫切的要求。”王云回忆说,“从70年代初到70年代后半段,IBM将数据管理的重点放在了关系模型的研发上,我很有幸地经历了那个时代。”

    1970年,IBM的研究员E.F.Codd提出了“关系模型”的概念,由此也奠定了关系型数据库的理论基础。他所发表的论文“A Relational Model of Data for Large Shared Data Banks”也业界被认为是在数据库历史上具备划时代意义的里程碑。此外,在1974年,IBM的Ray Boyce和Don Chamberlin又提出了SQL语言,这就实现了数据库生命周期中的全部操作,也为关系数据库发展奠定了另一块重要基石。

    随后,在经历了不断的发展和论证之后,最终关系型数据库成为了当时市场的主流。但是,很可惜,IBM却并没能利用好自己在技术上的优势而延续其在层次型数据库时代的辉煌。

    其实,从1970年“关系模型”建立之后,IBM就在San Jose实验室中增加了更多的研究人员研究这个项目——著名的System R。1977年,System R从技术上就已经是一个非常成熟的数据库系统了,并能够支撑重要的商业应用;1979年,IBM又完成了第一个实现SQL的数据库管理系统。但是,由于IBM对IMS的承诺阻止了System R的投产,一直到1980年System R才作为一个产品正式推向市场。

    然而,与此同时,Ellison敏锐地意识到了在“关系模型”这个理论研究基础之上可以开发商用软件系统;而在当时,大多数人认为关系型数据库不会有太大的商业价值。于是,Ellison开发了通用商用数据库系统Oracle,虽然当时的Oracle 1.0只能完成简单的关系查询,但其却为后来甲骨文公司的成长奠定了坚实的基础。

    那么,在当年,为什么“蓝色巨人”没能把握住自己这个价值上百亿的研究成果呢?有人认为,当时的IBM太注重理论研究了,研究人员大多也是学术出身,他们最感兴趣的是理论,而非推向市场的产品;也有人认为,更重要的原因是,当时IBM层次型数据库IMS的市场太好了,这反而成为了一种束缚。

    把DB2当成自己孩子一样的IBM软件集团中国区DB2信息管理技术经理刘晶炜也承认,当时IBM的技术太领先了,IBM把太多的经历放在谈技术上了;再加上,IBM在主机上的优势太明显了,根本不愁卖,层次数据库IMS的销售也非常好。可能正是因为在数据库市场上的优势太明显了,反而让IBM忽略了很多东西,因此没能把握住关系型数据库的统治时代,错失了领导地位,只能屈居第二把交椅。
 
    pureXML让DB2异军突起

    转瞬,时间到了1982年,IBM PC的出现标志着IBM又一辉煌时代的开启,在以后相当长一段时间内,在各种品牌的个人电脑上的“IBM PC Compatible”字样见证了IBM在这一领域的辉煌。

    “在上个世纪80年代以前,人们谈论更多的是服务器,而1982年个人PC的出现让人们的工作方式发生了某种转变,IBM在1983年推出的DB2也正是为了适应个人电脑的发展进程。”IBM软件集团数据管理市场部全球副总裁Inhi Cho Suh介绍说,“但是,在当时还并没有考虑到业务数据之间的关联。”

    然而,随着信息技术的发展和企业业务应用的变革,人们发现关系型数据库的技术虽然已经很成熟,但是其局限性也越来越明显——其能很好地处理所谓的“表格型数据”,但却对越来越多的复杂型数据无能为力。

    从上个世纪90年代以后,业界就开始研究和寻求新型的数据库管理系统。在很长一段时间内,很多人都把大量的精力花在了研究“面向对象的数据库系统”上。然而,经过数年的发展,“面向对象的关系型数据库系统”的进展并不理想。

    那么,“面向对象”的这种方式为什么没能取得成功呢?“其不成功的原因主要在于,面向对象的数据库的设计思想是企图用新型数据库系统来取代现有的数据库系统。这对于很多已经运用数据库系统多年并积累了大量数据的用户,尤其是那些大型企业用户来说是无法接受的,因为新旧数据间的转换会带来巨大的工作量以及巨额的开支。”刘晶炜说,“此外,‘面向对象的关系型数据库系统’还使得查询语言变得更复杂了。”

    后来,Internet的异军突起以及XML语言的出现,给数据库的发展开辟了一片新的天地。正是由于企业之间以及企业内部信息交换的需要,使得作为标准化数据存储格式的XML的数据量快速增长。“事实上,从那个时候开始,每个行业都在实施XML数据标准,新版的微软Office软件也以XML格式存储文档。”王云介绍说,“此外,越来越多的企业也开始转向使用XML技术,以便在不同的系统和应用程序之间交换数据并适应快速变化的环境。”

    “IBM很快意识到,XML不仅仅是一种数据格式,而且其更可以作为一种转换数据或者是增强业务灵活性的工具。”Inhi Cho Suh表示。正是在这样的大背景下,各大数据库厂商推出的新版关系型数据库产品纷纷开始提供对XML的支持。

    2000年,IBM发布了DB2 XML Extender,成为了第一个为数据库提供内置XML支持的厂商,并且从DB2 V7.0开始一直到DB2 V8.2都提供了这种支持。随后,Oracle、Sybase、微软等发布的新版数据库产品也都增加了对存取XML数据的支持。但这些却并没有从根本上改变关系型数据库的固有血统,因为这些产品都只能被叫做是“XML-Enabled”数据库,XML都还只是附属功能。

    直到IBM DB2 9的出场才完全改变了这种传统方式,其使用了IBM已经注册的了“pureXML”来管理以XML格式存储的数据。这就意味着它可以提供XML数据的“原生态”存储,而不是将数据转化成行列格式,也不需要将其作为大型对象来存储。“pureXML技术从真正意义上提供了一种与XML层次型结构相匹配的层次型存储方式以及相对应的操作访问方式。”刘经纬表示。

    “pureXML技术以及混合型数据库的出现,不仅提供了一种存储XML数据的更有效方式,同时由于pureXML所代表的层次型数据组织方式,使得我们拥有了关系型和层次型两种数据建模的方法。”刘经纬表示,“即使对于不涉及任何XML数据的应用,pureXML所代表的层次型数据结构和面向对象的设计方式,也可以对关系型数据库的设计方式提供重要补充。”因此,可以说,pureXML让IBM在混合型数据库的时代重新掌握了主动权。

    “让我们感到很惊喜的是,pureXML技术推出后,DB2 9在很多行业得到了很好的应用,有些甚至是我们之前没有料想到的。比如,在国内医疗行业的成功应用正是由于pureXML技术对于像电子病历这种不同形式的数据的有效管理。”刘经纬介绍说。

    从DB2到IOD

    其实,从上个世纪90年代开始,基于PC的客户/服务器计算模式以及企业软件包的广泛应用,就使得数据管理的变革已经基本完成。数据管理早就不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理方式。

    2003年,IBM就将“数据管理”产品统一更名为“信息管理”产品,目的就是为了改变很多用户对DB2的传统认识——DB2家族产品只能完成单一的数据管理,同时也强调了DB2产品家族在信息处理与集成方面的能力。

    随后,2006年,IBM又制定了IOD(信息随需应变)战略,希望能够帮助企业将业务数据转换成企业资源,从而实现从“数据”到“信息”,再到“智能”和“洞察力”的转变。在IOD理念中,IBM提出了企业构建信息管理的三层架构:底层是数据库、内容管理;中间一层是仓储与主数据管理、信息集成;上层是商业智能与性能管理。

    “以前,很多企业用户只注重数据的来源,以及数据的展现,也就是数据库和商业智能,而忽略了仓储与信息的集成。事实上,中间这一层是非常重要的,其可以让企业的数据存在于一个非常可信的环境或空间中。”Inhi Cho Suh说,“尤其是现在,企业信息的来源越来越多、也越来越复杂,如果不对这些信息进行维护、管理和日常的转换,这些数据就是不可信任的信息。”

    “而信息的融合包括把各种环境中的数据,包括非IBM数据库环境中的数据和信息融合起来。在完成了对Cognos公司的并购后,我们真正获得了商业智能技术,使得IBM在从信息来源一直到提供商业战略眼光的整个过程中都有很强的技术支撑。”Inhi Cho Suh补充说。

    其实,用户对于数据仓库以及商业智能的需求在很早就出现了,上个世纪60年代后期出现了一种新型数据库软件——决定支持系统(DSS),其目的是让管理者在决策过程中更有效地利用数据信息。1985年,第一个商业智能系统由Metaphor公司开发出来,当时就是用来连接销售信息和零售的扫描仪数据。1988年,IBM的Barry Devlin和Paul Murphy提出了“信息仓库”的概念,之后,很多IT厂商都开始构建实验性的数据仓库。从90年代开始,数据仓库就开始被应用了。

    当然,IBM在强调信息整合的重要性的同时,可能更多地也是在强调自己已经能为用户组建起端到端的全面信息管理平台。目前,IBM已经确立了企业数据管理、信息整合应用、企业内容管理和商业智能作为IOD的四大功能支柱。其中,企业数据管理基于IBM的数据库产品线,包括DB2、Informix和Solid等;信息整合应用面向Web 2.0,为企业提供全面的信息整合产品和主数据管理架构,并使SOA架构下的信息服务成为可能;企业内容管理融合了Filenet流程管理解决方案,提供以内容为驱动的企业流程整合平台;商业智能方面则整合了Cognos的产品和技术,提供基于开放标准的商业智能和绩效管理技术与服务。

    此外,借DB2 25周年之际,IBM专门推出了针对特定行业的“信息议程(Information Agenda)”,以帮助企业快速地访问信息。“此次IBM推出的新软件和业务咨询服务可以帮助18个主要行业内的客户创建‘信息议程’。”王云介绍说,“利用这些议程,客户可以有效地管理、整合和分析信息,并针对不断增多的业务数据开发可行的使用计划,从而改善业务绩效。IBM充分利用自身的行业经验,通过提供结构化方法来帮助客户与IBM专家沟通咨询,最终开发出理想的信息管理蓝图。全新的软件和服务还将帮助客户摆脱大量应用的限制、增强市场竞争力,成功转型为信息型企业。”


第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。