【精彩回顾】钟勇:全闪存解决方案在企业数据中心的应用

2016-04-28 11:30:21  来源:CIO时代网

摘要:2016年4月23日,由中国新一代IT产业推进联盟主办,CIO时代网承办,北大信息化与信息管理研究中心、北大CIO班教务办协办,专业云计算服务商UCloud冠名的“北大CIO中国行--上海站”活动在上海中星铂尔曼大酒店顺利召开。
关键词: 闪存 数据中心 CIO
  2016年4月23日,由中国新一代IT产业推进联盟主办,CIO时代网承办,北大信息化与信息管理研究中心、北大CIO班教务办协办,专业云计算服务商UCloud冠名的“北大CIO中国行--上海站”活动在上海中星铂尔曼大酒店顺利召开,众多CIO、知名企业家围绕本次活动主题“制造业2025”,共同探讨“传统制造业的升级之道”。宝存科技FAE Team Manager钟勇带来的演讲为《全闪存解决方案在企业数据中心的应用》,他首先介绍传统SAN架构和Flash在读写、采购成本、耗电量三方面的差异,具体分析VMware+Flash解决方案的优势,通过案例分享要根据用户需求达到用户期望。以下为演讲实录:
\
宝存科技FAE Team Manager 钟勇
  感谢各位莅临今天的会议,刚才大家听了很多软件、应用架构方面的介绍。我作为闪存厂商的技术顾问,来向大家介绍一下当前数据中心和闪存在一些应用结合和架构方面的小知识。
 
  现在企业数据中心在发展过程当中,变得很庞大。这个庞大不仅仅是应用越来越多,数据容量越来越大。数据中心这边的需求实际上也越来越丰富。同时发现一个问题,就是我们的服务器整体性能,我们的存储整体性能,并没有像应用发展一样的往上去增长。我们现在买到的服务器使用了更新的CPU,核数更多。内存容量更大,运行频率更高。但是却无法和服务器CPU、内存的性能提升一样线性地提高对更多、更大应用平台的支撑。这是因为什么呢?因为我们买到的服务器产品上面用的存储这一块还是传统的存储,并没有把存储变成一个半导体的架构。接下来就会慢慢的跟大家介绍一下闪存给我们带来的好处。
 
  为什么要用闪存?闪存本身是个半导体设备,例如CPU、内存等全都是半导体设备。多年以来,摩尔定律推动着半导体产品每18个月性能就会翻一番,价格却不会增长。这就相当于相同性能的半导体设备一年多久降价一半,于是多年来我们CPU、内存的性能一直都在高速增长。但是在本地存储这一块,多少年前我们用10K、15K的SCSI磁盘。现在大家还在用SAS/SATA磁盘,我们发现多年来磁盘的转速依然保持在10K、15K,容量也没有更大的增长。实际上基于磁碟和马达的机械硬盘已经到了一个瓶颈,如果没有新的技术和材料替代的话,盘体就发展到头了(SCSI、SAS、SATA都只是磁盘的外部接口,并不会从根本上提高产品的性能和容量)。于是闪存这个介质进入了大家的视野。以前我们在用闪存的时候,基本上都是在消费类的产品上面--手机、相机。大家的一些笔记本硬盘可能会用到闪存,那个时候觉得这个东西很快,但是很贵。如果用在企业产品里面,要用这么大的闪存,是不是就会很贵很贵,或者完全没有办法接受,在很多年前确实是这个样子。随着技术的成熟和价格的降低,近几年才会慢慢把闪存引入到企业级产品当中,大家现在已经可以买到基于PCIe总线和接口的超高性能SSD产品。
 
  大家常见的SATA SSD和普通的磁盘相比有100倍的性能提升,价格增长了10倍。在企业级用的时候,会发觉10倍的价格和100倍的性能,还不是我们想要的最优化的方法。如果我们想要最好的表现,PCIe SSD进入了大家的视野。基于PCIe的SSD和基于SATA/SAS的SSD相比,有着本质上的改变。最初,为了让SSD产品被老的服务器,被老的台式机等老的IT基础架构兼容,出于兼容性目的用了SATA接口。慢慢的,随着业务的发展,用户发现SATA接口其实是瓶闪存介质发挥性能的瓶颈,于是就开始寻找更好的方式来使用闪存。PCIe是目前x86服务器和个人电脑上主流的总线和接口标准,属于高速串行点对点双通道高带宽传输,所连接的设备分配独享通道带宽,不共享总线带宽,主要支持主动电源管理,错误报告,端对端的可靠性传输,热插拔以及服务质量(QOS)等功能。最初是用显卡上面,直通CPU发挥显卡上GPU的最大性能。最初出于产品兼容性和闪存本身各方面的技术限制没有使用PCIe作为闪存的接口,而且早期并没有一个很好的控制芯片,可以去将NandFlash通过系统总线直接给CPU去使用。但是现在,我们国人已经拥有了自主可控的技术,通过PCIe直接将闪存芯片给到CPU去识别和使用,中间不再需要各种接口转换,各种协议转换。我们将这些协议转换和软硬件堆栈全都抽掉,实现非常好的性能表现,所以才会让有相当于机械硬盘一千倍的性能提升。
 
  这是一个传统的SAN架构的比较。大家可以看到,这一块小小的闪存卡,就能胜过一整个机柜机械存储的IOPS性能,并且我们的读写延迟也降低了一百倍。闪存介质本身,就是非常低延时的设备。基于机械硬盘的传统SAN存储,本身也可以通过增加磁盘来达到增加IOPS的目的。但是在增加IOPS的同时,SAN存储没办法同时提供低延迟。支撑更多类似数据库的应用系统,实际上是需要底层存储能有更低的延迟,这种状态是延迟敏感的。在延迟敏感的应用环境下,哪怕堆再多硬盘也实现不了好的性能表现。这时候闪存卡就可以帮助用户,在提供高读写带宽和超高IOPS的同时,提供一个很低的延迟。和一整套SAN存储相比,一张闪存卡采购成本当然很低。于是采购成本可以降低10倍,并且可以降低40倍以上的耗电量。
 
  说说TCO,整体拥有成本。很多人会觉得闪存卡这样的设备作为新的存储介质,一定会很贵。对于这样一种“很贵”的产品,怎么说:这东西划算呢?一个产品、一个方案,对用户来说是否划算,实际上看总体拥有成本。以前可能更看重购买费用,觉得这个东西买来花多少钱是我主要的投入,后面用的花了多少钱,可能很多人会被忽视掉。实际上很多时候运维费用会远远高于之前购买的费用,打个比方,就像打印机。买一台打印机,这个东西并不贵。但是后期如果买原装墨盒的话,买了几次墨盒基本上就相当于买这个打印机的钱。我们的目标就是降低TCO,并且希望降低运维费用在整个TCO中的比例,通过这种方式帮助用户调整结构,优化架构。
 
  假定我们有一套存储或者说有一套系统,是有3年的生命周期。相对于传统的SAN存储方案跟闪存的方案,我们发现买是25%的费用,用是75%的费用。也就是说75%的钱花在后期怎么用。包括:电力、运维、软硬件的维护费用,这样的一个费用构成。我怎么去优化这个费用?如果用闪存方案的话,服务器采购的费用会比传统的方案贵1.5倍。也就是说,为什么闪存介质一开始购买的时候会比传统的要贵一点。但是由于使用闪存以后,我的服务器数量可以除以二。也就是说,我通过更少的服务器达到了更好的性能,实现了我资产的优化,实现了更好的投入产出比。这边和服务器数量相比就是这样的,传统方案购买、运维。闪存方案购买、运维,可以看出来,在TCO方面,传统方案如果是“1”的话,闪存方案“0.75”。这就是为什么我们使用闪存去为用户创造价值的时候,会通过花钱来达到省钱的目的。
 
  说了前面那些架构,我们这边拿一个比较真实的案例来说。VMware,如果在VMware加上Flash。可以达到什么样的好处?如果是一台没有使用闪存卡的服务器上面,如果跑8-10个虚拟机的话,在使用了闪存卡的服务器上面可以跑更多的虚拟机。为什么?很多时候虚拟机上的CPU跟内存资源有空余,而且不少。但是如果再往上面开虚拟机,用户会反映:“有点慢。”运维就会看,计算资源都有空余,为什么用户会反映慢?因为虚拟机在一台服务器上都是有一定的密度,达到一定的密度,IO就会吃紧,后端的存储就会Hold不住。当我们将后端的存储从机械硬盘变成了SSD的时候,这个问题就迎刃而解了。虽然说SSD不是一个无限的,一直可以往上升的性能的提供者。但是我们确实可以比这些硬盘提供至少1.5倍的虚拟机的密度。也就是说,本来开8-10个就慢了,换了闪存卡开到15个以上,开到20个也不会觉得慢。这个时候就可以充分的渣干CPU跟内存的性能,可以让每台CPU内存都用足,通过这个释放整个产品的性能。
 
  我们这边也提到了更多的虚拟机,运行速度和管理虚拟机的数量,并且提高了虚拟环境的应用性能。这是用户体验,用户觉得慢还是不慢。这边一个案例是我们的一个真实案例,某地产公司Y。他们有一个“合同管理”ERP平台,基于SQL 2012数据库平台。该数据库平台是一台虚拟机,日常50多分钟才能导出一份年度报表,对于他们来说在那儿等着,这就是一个很令人纠结的事情。领导希望快速看到报告,但是他导出报告也真的需要这些时间,急也没有用。他们希望提高工作效率,并且他们预算有限。如果说换高大上的硬件,他们这边可能在费用方面也Hold不住,领导也不会批,必须提高硬件理由率,然后让性能得到提升,并且他们的系统是要有连续性的,不能停。微软在SQL2012里面有一个可以使用非共享存储的方式实现两台主机之间的数据同步,Y就是在这样的环境下面,在虚拟机上的本地存储,也就是虚拟机的闪存卡上面各放了一张卡,通过卡上虚拟机的数据文件进行应用的运行。在这样的环境下面,大家会看到实际上它的成本增加了一张卡、两张卡。Windows没有变,SQL2012,就是这些。对于用户来说,他不在需要运营和维护原来的SAN存储。SAN存储需要专业的运维人员,他这边就不再需要运维SAN存储,并且不需要每年为SAN存储交售后费用。
 
  这个架构帮用户做到什么样的好处呢?可以看一下。原来这个是15分钟,现在4分钟,这个是月报。之前15分钟完成的报告,现在只要4分钟可以跑完。年报原来50分钟,现在14分钟可以跑完。财务常用查询,原来21分钟,现在7分钟就可以跑完。对于用户来说做了什么改变?他每台服务器上加了一张闪存卡卡,撤掉了存储。
 
  看到了这样的表现,得到理想的性能提升之后。用户觉得:“我很满意,我省了钱,不再需要交存储的运维费用,就可以实现这样好的性能表现。”用户就很满意。我今天跟大家分享的东西,主要就是这些内容。如果大家有什么疑问,外面有我们公司的展台,我们可以互相沟通一下公司目前对于IT架构里面有什么样的瓶颈,或者说在这方面有什么兴趣的话,可以有针对性的进行进一步交流。
 
  谢谢大家!

第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:fanwei

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。