中信证券:AI时代需要什么类型的存储?

炒股的时候,看看金麒麟的分析师报告。本报告权威、专业、及时、全面,将帮助您抓住潜在的专题机会。 中信证券研究部

文字|舒涛胡叶倩文夏英蕾陈子英
本报告是人工智能存储系列报告中的第一篇。它从“AI时代需要什么类型的存储?”的角度进行了详细的分析和洞察。可供相关行业投资者参考。我们相信,在AI时代,显存带宽和容量升级将至关重要,存储和计算整合将是趋势。近内存计算正在蓬勃发展,我们看好投资机会。其中,HBM有望成为云训练的标准化主流显存解决方案。美国对华制裁收紧背景下,国内存储厂商加速进军逆势追赶,相关产业链正在提供重大投资机会。此外,CUBE有望成为设备端角点推理和超车的辅助路径,“打破AI存储的围墙”。通过定制和先进封装获得创新带宽,并使用封装技术来弥补工艺缺陷。这是目前国家推荐的满足AI存储容量需求的方案。实现存储与计算真正融合的突破并奠定基础,也是未来本地存储与融合计算值得关注的一个重要方向。

▍AI时代的大规模模型需要快速、重复地访问和操纵大量参数,增加了对“计算能力”和“存储能力”的需求。
“存储升级”应该与“计算能力升级”保持同步。主要体现在带宽和存储上DRAM 的年龄容量。随着模型成本的降低,后续的应用场景、代币使用量、用户数量都会大幅增加,从而产生对更大存储容量的需求。 AI产品存储架构分为三个层次。所有级别的存储平均容量和价格均有所增加,并且 DRAM 视频内存已与 XPU 辅助存储一起添加。以AI服务器为例,1)uA单个主存储机(SRAM)的容量随着计算机芯片数量的增加而增加; 2)非易失性辅助存储器(DRAM)使传统DRAM的容量增加了2-3倍,而DRAM显存是核心增加,需要大容量/带宽和高带宽要求(HBM(高带宽内存),高带宽存储)与GPU结合诞生,是当前主流的云解决方案。 3)3级非易失性存储(NAND/HDD)目前重点关注增加容量,但长期来看术语它专注于基于 NAND 的 HBF(高带宽闪存,高带宽闪存)架构的创新。由于第二层变化最大,因此本报告将重点分析AI时代将需要什么类型的DRAM显存。

▍显存升级针对不同场景:训练侧容量需求和带宽全面提升,推理侧带宽需求凸显。
1)终端推理:内存访问密集,更新的核心是显存带宽(=生成速度×模型大小)。在目前每秒 100 个代币的生成速率下,带宽需求达到 TB/s 级别,普通 DDR5/LPDDR5 之间的带宽差距约为 10 倍。显存要求低,约为模型参数容量的1.2倍。对低能耗的要求非常高。从产品选择的角度来看,新目前业界正在探索产品,趋势是先进封装。允许产品的小型化和定制化。主要制造商可能会向中长期存储公司推出针对带宽优化的标准产品。

2)云推理:密集内存访问、多用户这加剧了内存带宽和容量需求指数级增长带来的并发内存访问的瓶颈,带宽需求甚至成倍增长,导致基础刷新需求。在m个用户同时运行、适当使用批处理的情况下,云推理的带宽需求是客户端推理的m倍,容量增长系数小于带宽,功耗要求比客户端要求更适中。从产品选型来看,以HBM为主,GDDR/CUBE 2.0为辅,其他的。 PD 隔离的趋势可能会增加非 HBM 内存解决方案的普及。

3)训练结束:密集计算,升级计算能力是主要需求,显存容量和带宽需要全面提升。显存容量是基本要求,应相应升级。显存带宽是一个重要的辅助功​​能,有助于提高计算能力利用率,提高性能。显存容量要求为参数量(理论值)16倍以上,带宽要求为TB级。在产品选择上,HBM是主流。

▍在AI时代所需的存储升级中,“存储与计算融合”将是长期的必然趋势,而“近存储计算”则是当今的有效路径。
在查看当前的计算机内存架构时,DRAM 性能(带宽和容量)是最大的瓶颈。训练端的模型越大,对显存容量的要求就越高。推理端的并发用户越多,带宽需求就越大(训练陷入“容量”,推理陷入“带宽”)。需要立即更新。回顾未来显存升级的技术路线图,我们预计HBM(高带宽内存)解决方案将成为云训练的标准化主流显存解决方案,而CUBE解决方案(存储+计算栈)有望成为C解决方案的补充,以在推理/设备端“打破AI存储墙”。 HBM 解决方案随着 NVIDIA 主导的解决方案和领先存储制造商主导的国际标准不断发展。我们预计这将继续成为主要解决方案,特别是对于云显存升级而言。在美国对华制裁力度加大的背景下,国内股市GE厂商奋力突破和追赶,也注重配套相关产业链的投资机会。 CUBE 解决方案通过定制提供灵活性,并通过封装流程创新提供创新带宽优势,从而实现推理和最终用户的利益。基于定制化存储+算力堆叠方案(oblea/芯片),采用先进封装技术弥补制造工艺短板,渗透AI计算场景(受限于堆叠层数、容量不足、需要多颗芯片并行使用的训练场景),是目前国内打破AI存储围墙、满足AI存储需求的最优方案。实现曲线突破,为未来真正意义的计算与存储融合打下坚实的基础,也是未来国产计算的一个重要观察方向。解决方案。
▍危险因素:
宏观经济复苏速度不及预期的风险。云提供商资本支出低于预期的风险。人工智能应用的部署速度慢于预期的风险;公司核心技术和产品研发未按预期进展的风险。行业竞争加剧的风险;
▍投资策略:
AI时代,带宽、显存容量有了根本性的提升。计算整合是趋势,近内存计算正在蓬勃发展,我们看好投资机会。围绕国内HBM和CUBE相关产业链,以下推荐四个方向:
1)存储解决方案制造商:CUBE重点关注拥有原始存储制造商支持和先发优势的领导者,帮助他们产业化并利用他们,为他们提供所需先进的支撑设备和定制设计解决方案,进军高端市场。还要关注实施超薄 LPDDR 堆叠设备解决方案的公司。
2)半导体设备:产业支撑。受益于对先进测试和封装不断增长的需求,帮助优化流程和提高产量,并加速供应链的本地化。先进的封装和测试优势+本地化升级,重点是蚀刻、键合和减薄设备。
3)先进封装:随着高端存储核心的进步和设备可用性的提高,中国大陆制造商在先进封装能力方面处于行业领先地位,并正在扩大产能。混合链接是 CUBE 2.0 的核心。此外,HBM产业链中的先进封装制造商也提供CoWoS。
4)逻辑芯片公司:近存计算客户正在提高竞争力,推动产业加速发展化。一些DIS公司正在积极实施3D结构逻辑芯片。目前以边缘SoC/NPU为主,云推理卡正在逐步引入。近内存计算有望帮助逻辑芯片公司提高产品性能,获得竞争优势,并从不断增长的人工智能需求中受益。我们建议关注以设计为主导的设计公司。
与此同时,我们认为,在人工智能需求的推动下,存储仍处于超级繁荣周期的早期阶段。目前,未来六个月的短缺现象很明显,预计到 2026 年第一季度末,价格上涨将维持或扩大。预计至少到 2026 年底,行业供应将超过需求。我们对这一构造周期繁荣的可持续性持乐观态度。企业层面我们建议重点关注那些在存储领域快速发展并且有很强的逻辑从价格上涨中受益的公司。利基商店年龄价格开始上涨。支持企业级内存/SSD的芯片设计公司预计将间接受益。

新浪财经公众号
我们每天24小时播放最新的财经新闻和视频。更多粉丝福利,请扫描二维码关注我们(新浪财经)

Leave a Reply

您的邮箱地址不会被公开。 必填项已用 * 标注

Facebook Twitter Instagram Linkedin Youtube