供需大厅

登录/注册

公众号

更多资讯,关注微信公众号

小秘书

更多资讯,关注荣格小秘书

邮箱

您可以联系我们 info@ringiertrade.com

电话

您可以拨打热线

+86-21 6289-5533 x 269

建议或意见

+86-20 2885 5256

顶部

荣格工业资源APP

了解工业圈,从荣格工业资源APP开始。

打开

CXL技术如何在人工智能时代扩展数据中心存储容量的极限?

来源:SK海力士 发布时间:2025-01-25 270
电子芯片设计/电子设计自动化(EDA) 产业动态电子芯片设计
本篇文章将深入探讨SK海力士在CXL技术领域的研发进展。

当今世界离不开数据的运转——网络中不断涌动的1和0的数据浪潮,为从流媒体服务到人工智能等各类应用提供了源源不断的动力。为了应对这场数据洪流,数据中心必须采用更先进的存储解决方案,以满足日益增长的性能需求。

 

然而,传统的存储器扩展方法面临诸多局限。处理器和存储技术的限制,加之数据中心成本和能耗的不断攀升,愈发凸显了对革命性方法的迫切需求。因此,CXL®(Compute Express Link®)应运而生,这是一项具有变革意义的存储器互联技术,旨在解决人工智能时代所带来的挑战。

 

本篇Rulebreakers’ Revolutions系列文章将介绍SK海力士在CXL解决方案领域的研发历程,详细讲述公司如何克服行业规格缺失等挑战,并为CXL生态系统做出重要贡献,最终确立其在CXL领域的领先地位。

 

使命:利用新型互联技术

扩展存储容量

 

 

在人工智能时代,数据中心亟需不断扩展其存储容量,以应对日益增长的数据量。然而,采用传统方法扩展存储容量的成本过高且效率低下。例如,在单个CPU系统中添加太字节(TB)级存储容量,将显著增加总体拥有成本(TCO)1和功耗。试图通过增加存储通道或集成更大容量的存储器来解决这一问题,往往会导致能耗和热量的大幅上升,从而增加冷却系统和管理成本。这些现象凸显了设计创新型存储系统的必要性,这些系统能够以更快、更高效和更具成本效益的方式处理数据。

 

1总体拥有成本(TCO, Total Cost of Ownership):购置、安装和维护产品的过程中产生的所有成本,其中包括了采买、能耗及维护费用。

数据中心亟需增加存储容量,

以满足人工智能时代日益增长的需求

 

过去十年间,为了满足市场需求,业界持续致力于开发新的存储器互联技术。这一技术是指处理器和存储器之间交换数据的方法,在数据处理速度和效率方面起到至关重要的决定性作用。在传统的存储架构中,存储器与附近的单个处理器通过物理方式连接,当应用程序未充分使用存储器时,往往会导致存储资源供应过剩。而如CXL等的新兴存储器互联技术,则可以通过允许多个处理器共享存储容量来提高效率,从而解决这一问题。

 

这引发了业界对CXL的极大关注,然而,由于此项技术没有先例可循,且初期缺乏行业制定的规格,所以其开发过程面临诸多挑战。JEDEC固态技术协会(JEDEC Solid State Technology Association)2所制定的规格通常是为DRAM产品而设,在缺失此类行业规格的情况下,CXL的开发过程从根本上而言,比一般情况更为复杂。

 

2JEDEC固态技术协会(JEDEC Solid State Technology Association):一个拥有超过350家成员公司,负责制定全球微电子行业公开标准的领导机构。

 

在缺乏行业规格指导的情况下,SK海力士面临着开发全新CXL产品以突破存储器扩展壁垒的挑战。为了应对这一挑战,公司充分发挥其深厚的内部专业知识,并积极与行业合作伙伴携手并进。

 

 

 

探索未知:

从零开始开发开创性CXL技术

 

 

自2019年CXL问世以来,SK海力士迅速意识到该技术能够满足日益增长的存储容量扩展需求。作为一种开放性的行业互联技术,CXL统一了存储器、存储装置和处理器等不同系统设备的接口,支持存储容量共享等功能,使多个处理器能够访问同一存储器,从而提升数据共享效率。同时,它还支持存储池化(Memory Pooling),将来自共同存储池的存储器分配给不同处理器,以提高效率。此外,CXL还实现了存储器切换功能,允许数百个设备(如处理器)在独立处理数据的同时共享存储资源。

 

除了这些创新功能外,SK海力士在观察到市场和客户对CXL技术认可度不断增加,并意识到其在解决技术和成本挑战方面的潜力后,对该技术的前景愈加坚定。然而,公司必须克服一个重大阻碍才能启动项目,即首先解决行业规格缺失的问题。因此,在参与CXL标准化工作并与客户合作确定规格后,SK海力士迅速着手制定了内部基本需求文件。公司还与CXL控制器制造商合作,为规格文件制定了控制器要求。此外,SK海力士还与JEDEC固态技术协会和CXL联盟(CXL Consortium)3合作,积极推动业内CXL标准中DRAM相关规范的完善。

 

3CXL联盟(CXL Consortium):一个致力于制定CXL技术规格的开放性行业标准组织。

通过扩展系统存储容量和带宽,

SK海力士的CXL技术客服了存储器扩展难题

在协助制定行业标准和开发相关规格后,SK海力士加快了CXL技术的研发。在此过程中,SK海力士确定了满足客户需求的关键标准,即成本效益、高容量、优化带宽和可靠性。

 

首先,成本效益在CXL研发过程中至关重要。抵消CXL控制器高昂成本的关键在于将模块等存储介质的费用降至最低。鉴于高容量对促进大规模数据处理非常重要,公司认为CXL存储器的存储容量应达到现有DDR产品的2到4倍。此外,必须优化带宽设计,以充分发挥CXL模块的性能潜力。最后,可靠性和数据完整性须与主机存储器的高标准相匹配,从而赢得客户的信任。

 

为了满足这些标准,SK海力士的多个部门正在协同努力,致力于将TB级存储器打造成更加经济高效的解决方案。一方面,公司开创性地研发了存储池化技术,以实现多个设备之间的资源共享。另一方面,还成功开发了近内存处理(NMP, Near-Memory Processing)4技术,从而在数据源附近进行数据处理。这些创新技术有望为高性能计算(HPC)、存储器内数据库和人工智能等领域带来显著优势。

 

4近内存处理(NMP, Near-memory processing):一种在数据存储附近执行计算的技术,能够降低延迟并提升人工智能和高性能计算(HPC)等高带宽任务的性能。

 

通过这些不懈的努力,SK海力士已成功推进了开创性CXL产品的研发,这些产品将彻底颠覆存储器市场。

 

 

 

SK海力士不断壮大的产品阵容

推动CXL的未来发展

 

 

自2022年开发出首款基于DDR5的CXL样品以来,SK海力士不断加强其CXL产品阵容,其中包括创新型CMM-DDR5(CXL Memory Module-Double Data Rate 5)。采用第五代高速PCIe连接,CMM-DDR5可确保流畅、快速的数据处理。同时,CMM-DDR5提供高达128GB的容量,可满足当今人工智能和高性能计算应用对高容量的需求。此外,该模块还具有高水平的电源效率和安全性。

 

真实性能测试突显了CMM-DDR5所带来的变革性影响。与仅搭载DDR5 DRAM的系统相比,该产品可将系统带宽提升82%,容量提升100%。测试结果进一步表明,在人工智能运行时,每秒令牌性能(Token Per Second Performance)提升高达31%。而在高性能计算领域,其吞吐量效率更是跃升33%。CMM-DDR5不仅展现出卓越的性能表现,同时符合JEDEC固态技术协会和CXL联盟的标准。目前,随着CMM-DDR5产品逐步迈向量产阶段,客户正在积极开展对其进行验证和认证的工作。

SK海力士基于CXL的CMM-DDR5,

可有效提升人工智能和高性能计算的性能

 

SK海力士的其他CXL解决方案还包括Niagara 2.0,这是一款集成硬件和软件的综合性解决方案,允许多台主机高效共享大型存储池,从而最大限度地减少未利用或未被充分利用的存储容量。此外,CMM-Ax(CXL Memory Module-Ax)则是一种针对计算工作负载而优化设计的高性能内存模块,在提高人工智能和数据中心效率方面表现突出。

 

除了在硬件领域的显著进步,SK海力士还开发了异构存储器软件开发套件(HMSDK,Heterogeneous Memory Software Development Kit),以最大限度地发挥其CXL存储器的潜力。该软件工具包已成功集成到Linux操作系统中,进一步提高了其可访问性和实用性。硬件和软件解决方案的协同开发及其标准化工作,彰显了SK海力士对致力于创建一个蓬勃发展的CXL生态系统的不懈追求。

 

 

 

打破常规者专访:

下一代存储器与存储装置部,

崔源夏(Thomas)

 

 

 

本文采访了下一代存储器与存储装置部门的杰出工程师(DE,Distinguished Engineer)5崔源夏(Thomas),深入探讨了公司在CXL技术开发方面取得的突破性思维。崔源夏负责JEDEC固态技术协会和CXL联盟的标准化工作,并为CXL等下一代存储器开辟道路,采访中他详细阐述了CXL的发展历程以及其未来可能带来的影响。 

 

5杰出工程师(DE, Distinguished Engineer):是SK海力士的资深工程师,在各自领域出类拔萃,负责解决技术难题并指导下一代人才。

 

Q 在研发行业领先的CXL技术时,您和您的团队如何展现出打破常规的思维?

“在CXL研发过程中,我们秉持SK海力士VWBE6理念的工作原则,并借鉴DRAM和NAND闪存产品的丰富研发经验,主动向客户提出工作方法和初步的CXL需求设想。提前明确需求为我们深入探索CXL技术创造了更多机会,最终成功研发出首款CXL存储器产品。”

 

6自觉自愿地发挥才智(VWBE, Voluntarily and Willing Brain Engagement):是SK管理体系(SKMS)中强调的员工价值观之一。

 

“对我而言,我构想了一种将标准化和验证方法相结合,以融合DRAM和NAND闪存的创新方法论,并在CXL联盟中独立提出并完善了与DRAM相关的功能。通过这些努力,我深感自豪能够为公司最初的CXL部署战略贡献一份力量。这表明,即便像探索CXL那样踏入未知领域,我们也可以凭借自身的创新精神和坚韧毅力,找到解决新问题的答案。”

 

“此外,我自愿在JEDEC固态技术协会和CXL联盟中担任要职,以此助力公司在标准化工作领域的地位不断提升。”

 

 

Q 您如何看待CXL在未来人工智能生态系统中的发展?

“CXL有望被构建成一个能够实现超大存储容量共享的生态系统。若要在人工智能时代进一步拓展其应用,CXL亟需支持计算节点,以确保1TB以上的高性价比存储器可以按需提供带宽,并在存储层面保持可靠性和安全性。这将有助于降低总体拥有成本,提高系统平台内的存储器利用率。”

 

“构建如此庞大的生态系统,绝非SK海力士一己之力所能实现。这需要GPU和CPU制造商、CXL控制器和交换机供应商,以及CXL知识产权(IP)公司的紧密协作。我们计划与这些机构携手合作,以进一步推动和壮大CXL生态系统。”

关注微信公众号 - 荣格电子芯片
聚焦电子芯片制造领域的技术资讯、企业动态以及前沿创新,涵盖半导体、集成电路、贴片封装等多个行业领域的解决方案。
推荐新闻