当前企业级存储市场正面临“高性能需求激增”与“成本控制要求”并存的突出矛盾——一方面,AI大模型训练对内存带宽和存储响应速度提出极致要求;另一方面,数据中心运营商则在持续追求更低的总体拥有成本(TCO)。在这一背景下,存储与内存技术正朝着“更高带宽、更低延迟、更大容量、更优成本效益”的方向加速演进。
三星电子副总裁、Memory事业部首席技术官Kevin Yoon于9月25日参加第四届GMIF2025创新峰会时接受集微网采访表示,随着AI大模型训练、高性能计算(HPC)及企业级数据中心数字化转型加速,整个行业正从“计算为中心”向“数据为中心”深度转变,直接推动存储与内存技术迈入“更高带宽、更低延迟、更大容量、更优成本效益”的演进新阶段。为应对这一变革,三星针对性推出覆盖从AI加速到数据存储全场景需求的四大产品线战略布局,包括面向高带宽场景的GDDR7、破解传输瓶颈的CMM-D、聚焦高性能存储的PCIe Gen6 SSD,以及主攻大容量需求的QLC SSD,形成“端到端”技术解决方案矩阵,精准匹配AI时代存储与内存的专业化、先进化发展方向。
GDDR7:AI服务器的高带宽核心动力,筑牢训练性能底座
谈及GDDR7在企业级AI市场的定位,Kevin Yoon明确指出,这一新一代图形显存的市场增长核心驱动力,正来自AI大模型训练对“无延迟数据交互”的极高带宽需求——当LLM参数规模持续扩大,仅靠GPU会面临内存带宽和容量限制,需额外增加设备或进行昂贵升级,而GDDR7作为面向AI服务器和图形卡的关键高带宽内存解决方案,可有效解决这一痛点。
从技术与产品落地来看,三星已成功开发业界首个24Gb高容量GDDR7解决方案,并与领先图形处理单元(GPU)合作伙伴达成合作,进入大规模量产阶段。该产品通过尖端工艺技术与优化电路架构的结合,实现两大核心突破:其一,单芯片传输速率高达42.5Gbps,能为多GPU集群同时处理海量训练数据提供高速数据通道;其二,相较上一代产品能效提升约30%,在AI服务器24小时不间断运行场景中,仅内存环节就能为数据中心节省近1/3电力消耗,间接降低长期运营成本,为AI训练场景提供稳定、强劲的性能支撑。
CMM-D:重构数据传输链路,升级数据中心弹性扩展能力
对于创新产品CMM-D的应用价值,Kevin Yoon介绍,该产品定位为“计算与存储融合型方案”,核心目标是缓解AI/HPC场景下长期存在的数据传输瓶颈——在AI处理的代理和推理阶段,数据需保留更长时间以得出最佳结果,导致对内存容量需求急剧增加,而传统服务器中“CPU-内存-GPU-存储”的分离式架构存在明显链路延迟,CMM-D依托CXL(计算快速链路)技术,可实现内存与存储的“无缝衔接”,破解DRAM容量限制难题。
在技术迭代与未来规划上,目前三星CMM-D已全面支持CXL 3.0标准,能打破不同硬件间的内存壁垒;同时,三星正同步开发支持多台服务器之间“实时内存共享”的新设备,这一技术将彻底革新数据中心架构逻辑——跨服务器数据无需通过网络传输,可直接调用共享内存池资源,不仅将延迟降至微秒级,还能让内存资源根据负载动态分配,大幅提升数据中心扩展性与灵活性。更值得关注的是,自2021年推出全球首个CXL产品以来,三星始终引领CXL内存市场生态发展与行业采用,已实现基于DDR的CXL 2.0产品大规模量产,预计明年CXL市场将进一步扩大,届时三星CXL内存将升级支持CXL 3.1与PCIe Gen 6.0标准,推出新型CMM-D解决方案,实现“近内存处理引擎”功能等全面特性升级,让内存扩展更易、更快、更可靠。
PCIe Gen6 SSD:性能能效双重突破,匹配GPU处理需求
针对即将发布的业界首款PCIe Gen6 SSDPM1763,Kevin Yoon强调,在AI时代的大规模基础设施中,存储已从“后端辅助环节”升级为支撑复杂工作负载的关键组成部分——位于计算资源近端的TLC(三层单元)存储,需持续提升性能以匹配GPU高速处理需求,否则将成为系统“性能短板”,而PCIe Gen6 SSD正是应对这一需求的核心产品。
从技术创新与性能表现来看,PCIe接口迭代正加速推进,每一代性能均实现翻倍,但受高速下信号干扰与损失影响,PCIe PHY技术至关重要,且NAND速度与PCIe接口速度并非线性增长。为此,三星在PM1763研发中,通过优化NAND与控制器设计最大化I/O效率,尤其采用“向上扩展(提升单控制器性能)+向外扩展(支持多控制器协同)”的控制器架构。
这款产品在25W功耗限制(符合数据中心高密度部署电源标准)下,性能达到上一代产品的两倍,连续读写速度与随机IOPS(每秒输入输出操作)大幅提升,同时能效提升至1.6倍。这一特性对AI推理场景尤为关键,能以极低延迟为GPU提供数据,避免GPU处于“等待数据”的空闲状态,既提升系统整体效率,又通过能效优化降低长期运营成本。此外,三星已启动PCIe Gen7与Gen8技术研发,为未来更高性能需求提前布局。
32芯片堆叠技术:推升QLC存储密度极限,适配大规模数据集
在数据中心存储密度提升方面,Kevin Yoon详解了三星的技术路径:与近端TLC存储聚焦性能不同,位于计算节点远端的QLC(四层单元)存储,以实现“更高容量密度”为核心目标——通过在相同机架空间内存储更多数据,满足AI训练所需的大规模数据集(如自动驾驶场景的PB级路测数据)存储需求,同时减少机架占用数量,降低机房空间、电力与冷却系统投入成本,这与AI时代对大规模数据高效管理的需求高度契合。
三星新款QLC SSD BM1753是这一战略的核心产品,专注大容量存储场景,其关键技术支撑是先进的32芯片堆叠封装技术——通过将32颗NAND芯片垂直堆叠,在极小空间内实现超高容量。
基于这一技术,三星制定了清晰的产品迭代计划:今年已推出厚度为2mm的128TB U.2驱动器;计划在2026-2027年推出更薄的1mm EDSFF(企业级数据中心存储形态因子)驱动器,在PCIe Gen5平台实现256TB容量,在Gen6平台突破至512TB容量。EDSFF标准的“薄、宽、密”设计,不仅让设备在纤薄形态下具备高容量,还能提升能效与存储密度,进一步适配数据中心高密度部署需求,从“空间利用率”维度降低TCO。
总结:以全栈创新平衡性能与成本,开启AI存储新纪元
在GMIF2025创新峰会上,三星电子不仅展示了AI驱动下的存储技术创新成果,更传递了“以差异化产品应对多元化需求”的市场策略。通过GDDR7、CMM-D、PCIe Gen6 SSD和QLC SSD四大产品线的战略布局,三星构建了覆盖“高带宽-低延迟-高性能-大容量”的全场景解决方案,精准应对企业级存储市场“高性能需求激增”与“成本控制要求”的核心矛盾,同时适配TLC与QLC SSD因AI存储需求分化而呈现的不同发展方向。
从技术价值来看,这些创新产品和技术并非单纯追求“参数提升”,而是围绕“平衡性能与成本”展开多维优化:GDDR7的高能效降低电力消耗,CMM-D的内存共享减少硬件投入,PCIe Gen6 SSD的性能突破避免GPU闲置,QLC SSD的高密度优化空间成本,多举措共同实现“更低的总体拥有成本(TCO)”。对于数据中心用户而言,这意味着无需在“高性能”与“低成本”之间妥协,既能支撑AI训练、HPC等高端需求,又能控制长期运营投入。
展望未来,随着AI技术向物理人工智能演进,数据量与计算需求将持续增长,存储与内存技术的重要性将进一步凸显。正如Kevin Yoon所言,三星将继续突破技术极限,“在合适的时间,以合适的质量”提供解决方案,与客户和合作伙伴共同解锁企业级存储市场的无限可能性,为AI时代的数字基础设施筑牢技术底座。