首页 > 方案案例 > 正文

石油HPC 寻找鱼和熊掌的平衡点

2008-09-27 08:22:22  来源:计算机世界

摘要:在全球资源逐渐贫瘠,打井成本又不断攀升的背景下,石油HPC(高性能计算)正承载着越来越重要的使命。而在追求更高计算性能和降低单位能耗成本的双重压力下,如何找到最佳的平衡点
关键词: 石油 HPC

    在全球资源逐渐贫瘠,打井成本又不断攀升的背景下,石油HPC(高性能计算)正承载着越来越重要的使命。而在追求更高计算性能和降低单位能耗成本的双重压力下,如何找到最佳的平衡点也成为行业内关注的重点话题。

    一方面是对HPC绝对性能的不断追求,另一方面是日益严格的功耗成本控制,再加上如何对已有系统资源合理利用,构成了一道难解的命题。日前,在内蒙古呼和浩特召开的中国石油行业与英特尔2008年度高性能计算研讨会上,各方专家就有关话题展开了有益的探讨。

    随着全球能源价格的不断攀升和已探明石油储量的不断消耗,相对容易开发的油藏资源越来越稀少,在更广泛面积内找到可开采石油资源所耗费的代价也越来越高,这都导致了石油HPC计算模型和运算方式向更精细化的方向发展,比如随着石油勘探的地震成像/建模算法的不断进步,石油波动方程计算模型正在从二维向三维方向推进,计算面积也在不断增大。这些更精细的计算模型必然导致计算强度和中间数据量的急剧上升。

    从最新一期的国际HPC Top 500排行榜来看,上榜的地球物理应用系统从上届的43套增加到49套,依然处于上升趋势。

    来自英特尔美国总部的软件与解决方案部的兰斯·舒勒博士表示,对以石油HPC为代表的地球物理计算模型而言,增大物理复杂度(计算模型)、增加问题规模和缩短运算时间这三个方面是对HPC计算能力最主要的挑战。在这三个维度上,任意给定两个甚至一个后,追求另外维度性能的最大化则成为石油HPC计算解决方案优化的核心。

    传统上,石油HPC主要涉及地震成像和油藏模拟两部分。前者最关注HPC系统的浮点计算性能,后者更侧重对大内存的需求。而逐渐兴起的计算可视化浪潮则对GPU(图形处理器)等新型计算单元的应用起到积极的推进作用。

    面对这些复杂的因素,对于节点机来讲,不断提高处理器的浮点性能、I/O和存储带宽已经成为其中最核心的关注焦点。

    增加处理器的核心数量已经逐渐成为提高浮点运算能力最主要的趋势,而在一些特定场合,采用类似GPU的多浮点单元处理器也是很有竞争力的可选方案。目前NVIDIA等GPU厂商已经推出了相关方案,英特尔Larabbe GPU(初期可能会采用16核心)也将在今年下半年面世,后者还兼容X86指令系统,届时用户在这方面也会有更多的选择。

    在I/O方面,固态存储(SSD)因为功耗低、I/O能力性能出众有望逐渐替代硬盘,虽然目前受成本等因素制约还比较明显,但其在节点机系统中的应用已经是一个不可阻挡的趋势; 而在高存储带宽方面,将内存控制器内置于CPU和采用新型的高带宽互联架构将成为必然。

    在HPC系统一级,则有两点趋势比较瞩目,一个是系统将更加关注运算、I/O和存储三者性能的匹配; 另一个是提高系统和应用软件的并行化,即如何充分利用越来越多的并行运算资源(无论是CPU还是GPU以及可能的多种加速器),以达到最佳的能效比。尽管方向相对比较明确,但目前在技术实现方面还面临比较大的挑战,需要更长的时间准备。

 
    专用计算“入侵”HPC


    在提到石油HPC未来新的技术发展趋势时,与会很多专家都提到了GPU和FPGA(现场可编程逻辑门阵列)等专用加速器的采用对应用带来的影响。

    以GPU为例来讲,可能有两方面的影响,一个是采用多核、多流水线的GPU作为浮点运算单元提高整个系统的运算能力,另一方面是作为可视化计算的最后呈现手段对中间数据进行实时解释。

    前者实际上是将GPU作为一种专用加速器。由于这些专用加速器往往采用与主CPU不同的指令集,在目前业界流行的集群体系架构下,混合编程可能会给系统应用效能的调优带来巨大的不确定性。

   这方面更典型的例子是采用FPGA器件进行可重构计算。尽管FPGA在进行特殊运算时性能很高、功耗极低,但放到整个HPC系统内的效果还有待观察。这是因为前者仅仅针对节点中的一个核进行对比,并且只考虑到了计算时间,并未综合考虑数据刷新和读写时间,而且这仅仅是针对核心计算的统计,整个应用所耗费的时间也未考虑在内。所以,专用加速器往往可能在算法级别上获得较大优势,但通常很难满足整个应用的加速目标。中石化南京石油物探研究所的赵改善还提出了一个很现实的问题,因为专用加速器往往在编程方面比较复杂,在采用专用加速器时,其风险和难度也必须充分予以考虑。

    而可视化计算最终的推进力是实时分析决策要求的不断提高。要做实时分析决策,对数据的精确性、直观性和实时性都有很高的要求,因而新的计算可视化在技术方面就具有一些新的特点,包括对巨量内存的支持、远程访问、协作(collaboration)和大容量渲染,以及多显示等功能,这些都需要高端显示芯片(GPU)的支撑,对系统的I/O和存储带宽也都提出了很高的要求。
    降耗和管理成为新话题


    除了探讨技术话题之外,与会的专家也开始越来越关注HPC系统的能耗和管理问题。

    全球HPC行业都面临着性能提升和降低功耗这一日益尖锐的矛盾,石油HPC也不例外。中国石油东方地球物理勘探有限责任公司(BGP)拥有1.4万个CPU、2.6万个内核的地震资料处理系统,综合实力排全球第四,陆上地震勘探市场位居第一,也是国内规模最大的石油物探公司。

    据BGP副总工程师赖能和介绍,近年来随着BGP数据中心计算规模的不断扩大,能耗正以惊人的速度增长,仅电费一项,就从2005年的330万元提高到去年的790万元,今年预计还将增长到1300万元。

    对机房制冷系统的改进和供电系统的高次谐波治理成为节能降耗的重要手段。仅仅是降低供电系统的谐波系数一项,BGP一年就节省了34万元。另外,BGP还开发和应用了自适应节能管理软件,经过实验,节能效果达到25%~30%。

    另一方面,软硬件资源优化集成还有巨大的潜力可挖。

    目前,很多国内比较先进的石油HPC系统都已经达到甚至超过1000个CPU的计算规模,再加上存储节点的增加,系统资源逐渐膨胀起来。而国内很多单位在当初采购HPC系统的时候普遍很少关注系统I/O、互联网络和存储的匹配问题,往往出现重CPU数量、轻内存和存储匹配,重硬件购买、轻软件优化和有效管理的现象。

    很多用户意识到,有效的管理不但能够提高系统的效率,还能够节约能源。BGP建立了联网的计算机设备维护信息管理系统。利用数字化技术,实现了对整个HPC机房和每个机柜的CPU、网络等情况做出实时监控,可以及时、有效地调配资源,节能效率得到了明显的提高。

    根据统计,2006年BGP的CPU平均利用率为23.6%,2007年上升到了27.6%。CPU利用率的提升还得益于对一些先进技术的采用,比如采用InfiniBand互联网络,将I/O效能提升了5倍。同时将HPC系统的FC-SATA光纤盘阵与SAN系统整合,利用SAN的共享功能,使I/O与盘阵从1对1变成了多对多,也提升了存储和I/O的效率。这些技术手段的采用,改善了CPU计算能力与I/O和互联网络之间的带宽匹配,从而提高了系统整体的应用效率。


第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。