2024-03-14 09:54:36 来源:
然而,在现实工作中,依然存在着购买了AI平台和服务器之后,因为软件适配问题,而让价值数百万的AI平台无法运转的情况。因此,我们必须要走入AI创新的背后,去思考在普智时代到底需要什么样的IT基础设施支撑了。
流淌的数据
要想让人工智能发挥作用,算法、算力和数据是必不可少的三要素。一般人只关注AI在算法方面的变化,但殊不知,没有了如血液一般的流淌数据,AI同样不能发挥作用。而要让与AI相关的数据流动起来,数据存储的作用就凸显出来。
更为重要的是,如戴尔科技集团大中华区信息基础架构解决方案事业部存储业务总经理刘志洪所言:“AI爆发之后,不可能也没有必要为AI单建一套存储系统,因此企业AI战略的成功取决于存储系统如何更好地服于于AI创新。”
刘志洪对此解释说:“戴尔科技的远景是以科技创新推动人类进步,作为科技创新里重要的一环,存储业务是要为任意的数据和任意规模的数据来构建整个产品组合。具体说来,当前的数据种类已经不限于块数据、文件数据和对象数据,由于AI的流行,很多数据是机器生成,甚至是机器根据机器生成的数据进行再加工。因此在AI时代,数据如何存储、管理、优化就被赋予了新的命题。”
然而,这却不是一个容易解决的命题。AI的普及让新的应用方式层出不穷,存储本身简单易用和互联互通就变得非常重要。从应用环境来看,多云成为主流,同时边缘端也越来越广泛地应用IT来处理生产线和终端。当AI兴起时,就不仅需要数据存储系统的灵活拓展,数据安全也成为一个重要问题。因此,综合来看,这一命题的解决就需要让数据存储兼顾安全、高效、智能化,以及对多云的支撑。
刘志洪把这一命题的解决概括为:“在不断变化、注重安全的多云世界里,戴尔科技以软件驱动的创新提供持续化的存储体验,帮助用户提升效率、强化安全、提供多云的灵活性以应对不可预知的IT挑战。”
围绕着这个命题的解决, 戴尔科技集团大中华区存储产品部总监范圣俭透露:“戴尔科技研发投入已超过79亿美元,ISG工程人员中的软件工程师比例已经超过了85%。通过软件驱动型存储创新,近期已经实现了超过2000项新功能,相当于每天都可以交付一款新产品或更新后的产品。”
UDS掀起的冰山一角
AI的火爆催生出业界对于算力无止境的追求,存储运营管理如何助力AI应用,成为业界一个关注的重要问题。为了解决这一问题,戴尔科技不断推推沉出新,这次全新全闪存PowerScale F210和PowerScale F710更是成为了助力急先锋。这同时也给我们提供了一个机会,让我们能够窥见戴尔科技拥抱AI架构的全貌。
AI的成功落地依赖于一个完整的体系支撑,戴尔科技事实上已经为AI创新提供了一整个AI就绪数据平台。戴尔科技集团大中华区非结构化数据存储事业部产品经理李海介绍了整个平台的构成。
他介绍道:“这个平台从上到下包含了三个层面。最上面是种类众多的软件生态合作伙伴,可以实现从数据分析工具到AI的流程化软件,再到多种云生态的全面支持。AI注定会成为用户整合生产力和产业链的重要一环,很多用户已经在把工作负载和数据分析、机器学习,与云上、云下的数据实现紧密结合,所以我们不仅仅要实现对于AI本身的支持,还要延展到数据管理、软件工具的支持,以及实现云上、云下数据的打通。”
谈到AI平台的中间层,李海接着表示:“第二层是现代化数据湖仓层。现在生产数据广泛存在于本地机房和云上,同时更多数据开始散布于边缘端。这个时候要想充分运用昂贵的GPU算力,挖掘出每一块数据后面的价值,就需要一套有效的组织方法和工具,帮助用户实现数据价值,而这就是我们帮助用户搭建一个现代化数据湖仓的理念。用户只需要通过一个统一的接口访问云上、云下和边缘端的数据,就能让所有的数据变成AI的能量,产生出应有的价值。”
李海接着介绍了最下面的一层:“最下边一层是AI优化层,其中有存有算,包含了PowerScale、ECS和ObjectScale,可以实现分布式文件定义系统、对象存储以及软件定义的对象和文件存储,不同场景之下的AI工作负载需求就全部可以得到满足。此外还有戴尔科技的Validated Designs,可以提供一整套方法论和服务,帮助没有经验的用户更好地搭建自己的AI平台。”
从戴尔科技AI就绪数据平台的架构,以及戴尔科技发展数据存储的整体思路中,我们不难发现戴尔科技正在不断通过创新,让戴尔科技AI就绪数据平台的优势得到扩大。而在数据存储层面,新品也必然是按照更高性能和规模、更快的效率、更高的安全性,以及不断提升的多云敏捷性,来向前演进的。
戴尔科技集团大中华区存储产品部产品经理岑广海肯定了这种思路,他介绍说:“PowerScale是一个横向扩展的存储家族,同一集群可以安装不同代、不同类型节点,此前已经有A300、A3000、H700、H7000、F900、F600、F200节点,现在又扩展出F710和F210。F710和F210确实是在灵活性、安全性、存储效率方面更进了一步,可以实现2.2倍的流式写速提升、2倍的流式读速提升,以及2.6倍提升的高并发、低延迟工作负载处理能力,在功耗方面也实现了更高的每瓦特性能。在容量及密度上有大幅提高,兼顾了性能和扩展性、多云支持、原生安全性和效率增强。”
岑广海特别强调:“AI应用需要一整套生命周期管理,而不单纯是拿一个GPU服务器跑起来就可以了。从完整AI生命周期出发,就需要考虑如何实现数据提纯,之后又如何对数据进行提取、清理,再到训练和调优,最后还要考虑后期的推理。为了完成这个生命周期的管理,我们综合考虑了数据的存和取所需要的性能,F710和F210中2倍以上的性能提升,意味着用户可以更快地把数据灌到GPU中。如果训练中出现问题,需要瞬时保存状态,AI海量数据也需要更高效的能源利用,我们在推出F710和F210时,已经综合考虑了这些问题。”
合作,前行的基础
当前,推动AI应用落地的源动力,已经变成了大模型应用,而大模型应用致胜的核心,无疑是生态。在生成式AI的演进过程中,英伟达无疑是一个赢家,不仅让市值登上了一个新的高峰,还为自己未来发展潜力打下了伏笔。而戴尔科技很早之前就在这方面,和英伟达共同进行了布局。
李海介绍说:“在AI方面,戴尔科技与英伟达自2015年起,一直进行着密切的配合。从更早一代的英伟达一体机,到最新的马上要获得认证的产品,我们跟英伟达在软件、硬件、服务方面,通过认证做了充分的结合。通过认证可以给用户一个完整的、经过验证的解决方案,让用户可以在最短的时间内,把最新的AI硬件和软件技术应用于现实的场景中去,而不再需要做很多的探索工作。”
谈起这个认证,李海进行了更为详细的介绍:“与其他厂商相比,我们的认证有三个优势。首先是我们的认证是两条腿走路,既可以基于InfiniBand,也可以基于以太网,这样我们就同时支持封闭系统和开放系统。其次我们的认证是基于最新的、全线的全闪产品,包括今天最新的F210、F710,全线产品都是在英伟达平台上做的认证。最后我们的认证是全方位的,不仅仅在一个产品层面,还包括了软件层面和服务层面。”
从这些不难看出,无论是在整体平台层面,还是生态层面,戴尔科技都为普智时代的到来做好了准备。不断涌现的新品既是在强化戴尔科技AI就绪数据平台,也是在让多年来构建的AI生态系统更为强大。在这些推力的作用之下,2024年将注定成为AI创新应用的元年。
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。