这两年,生成式 AI 的发展速度远超预期。无论是文本生成、图像生成,还是企业内部的智能应用,大家最关心的问题往往是 GPU 算力够不够。但在实际训练过程中,许多企业会发现,显卡并不是唯一的瓶颈。即便 GPU 部署规模很大,如果数据供应不上,训练任务依然会被拖慢。而真正决定训练周期和能耗的,往往是存储系统。

为什么训练大模型对存储要求高?
大模型训练需要持续处理海量的数据集,规模动辄达到 TB 级甚至 PB 级。这些数据必须被快速加载、打乱,并分发到不同的计算节点,而且这个过程会反复进行。训练不是一次性的读取,而是长时间的高并发读写。如果存储系统速度跟不上,GPU 就可能出现“闲着等数据”的情况,算力资源被浪费掉。
另一方面,训练通常持续数周甚至数月。长时间运行对硬件寿命、稳定性以及功耗提出了更高要求。对企业来说,这不仅关系到训练能否顺利完成,也直接关系到整体 TCO(总拥有成本)。

企业级 SSD 在这样的环境里展现出独特价值。它们在长时间高负载下依然能保持性能一致,而不会出现突然掉速的情况。面对数百个 GPU 节点同时访问时,也能维持低延迟和稳定响应。同时,它们在可靠性设计上更完整,比如具备健康监测、纠错和断电保护机制,能有效降低长时间训练过程中的风险。
对企业而言,这种稳定和可靠比单纯的速度更关键。因为一旦训练任务中途出错,可能就意味着数十万甚至上百万的算力资源被浪费,需要重来。相比之下,能让系统长时间无故障运行的存储,才是真正保障效率和成本控制的核心。

激发 AI 潜能,企业 SSD 如何赋能 AI 发展:铠侠LC9系列
在企业级 SSD 的发展方向上,铠侠推出的 LC9 系列值得关注。这是一款基于 QLC 闪存的企业级 SSD,设计目标就是满足 AI 训练和大规模数据中心的需求。它提供高达数十 TB 级的单盘容量,使得企业能够在更少的机柜中容纳更多数据集,从而提升机架密度,降低运维复杂度。

在性能层面,LC9 系列采用 PCIe® 5.0 接口和 NVMe™ 2.0 协议,带宽相较 PCIe® 4.0 有成倍提升,更适合大规模 GPU 集群的并发数据传输。其底层还采用 CBA封装技术,缩短信号路径、降低延迟,并改善能效表现。

铠侠将持续推进存储技术创新,不断提升性能、容量与可靠性,为企业客户和开发者提供高效、可靠的存储解决方案。同时,铠侠致力于满足AI领域日益增长的存储需求,助力企业在激烈的市场竞争中保持领先,并通过与产业伙伴的紧密合作,共同推动AI技术的发展与应用。
注:
截至2025年7月22日,基于铠侠调查。
容量的定义:容量的定义:铠侠定义1千字节(KB)为1,000 字节,1兆字节(MB)为1,000,000字节,1千兆字节(GB)为1,000,000,000字节,1兆兆字节(TB)为 1,000,000,000,000 字节,1 kibibyte(KiB)为1,024字节。但是计算机操作系统记录存储容量时使用2的幂数进行表示,即定义1GB = 2^30 = 1,073,741,824字节,1TB = 2^40 = 1,099,511,627,776字节,因此会出现存储容量变小的情况。可用存储容量(包括各种媒体文件的示例)将根据文件大小、格式、设置、软件和操作系统和/或预安装的软件应用程序或媒体内容而异。实际格式化的容量可能有所不同。可用存储容量(包括各种媒体文件的示例)将根据文件大小、格式、设置、软件和操作系统和/或预安装的软件应用程序、或媒体内容而异。实际格式化的容量可能有所不同。
闪存容量的计算方式为:1Tb = 1,099,511,627,776 (2^40) 比特,1TB = 1,099,511,627,776 (2^40) 字节。
对于RocksDB应用,铠侠确认,当启用FDP功能并配合插件(一款由铠侠在其官方GitHub账户上发布的功能扩展程序,地址:https://github.com/kioxia-jp/ufrop)使用时,写入放大因子(WAF)约为1.1。
KIOXIA LC9系列固态硬盘支持Leighton-Micali签名(LMS)算法,该算法被CNSA 2.0(商用国家安全算法套件 2.0)认可为数字签名算法,可防止固件被篡改,以抵御量子计算机对传统加密算法构成的威胁。密钥长度为256位的高级加密标准(AES-256)是KIOXIA LC9系列固态硬盘中使用的数据加密算法,也得到了CNSA 2.0的认可。
“2.5英寸”表示固态硬盘的外形尺寸规格,而非物理尺寸。
读取和写入速度可能因主机设备、软件(驱动器、操作系统等)和读取/写入条件等各种因素而异。
此为初步性能,如有变更,恕不另行通知。
提供支持安全即时擦除(SIE)、自加密硬盘(SED)以及符合FIPS(联邦信息处理标准)的SED等可选型号。
受出口和当地管制,安全选项可能在部分国家/地区不可用。
NVMe和NVMe-MI是NVM Express, Inc.在美国和其他国家的注册或未注册商标。
PCIe是PCI-SIG的注册商标。

瀚铠