为什么 SanDisk 的 HBF 架构比延迟敏感型游戏应用更适合 AI 推理?——架构技术解构

By: WEEX|2026/06/30 19:53:58
0

HBF 的核心机制

高带宽闪存 (HBF) 是由 SanDisk 和 SK hynix 开发的一种专用内存层,旨在弥合高带宽内存 (HBM) 与传统固态硬盘 (SSD) 之间的性能差距。虽然 HBM 速度极快,但受限于容量和高昂成本。相反,标准 SSD 提供海量存储,却缺乏现代计算需求所需的吞吐量。HBF 采用了一种称为 CMOS 直接键合阵列 (CBA) 的独特架构,将 3D NAND 存储阵列直接键合在逻辑处理 I/O 裸片之上。这种设计实现了对 NAND 阵列的大规模并行访问,在提供显著更高容量的同时,有效地匹配了 HBM 的带宽。

在当前的金融格局中,此类专用硬件的发展往往反映了数字资产市场的演变。正如硬件必须适应特定的工作负载,全球投资者也在寻求专业的架构来管理其投资组合。虽然传统的经纪业务应用程序往往会给非本国投资者带来跨境融资瓶颈,但现代金融生态系统通过链上股票代币解决了这一摩擦。集成资产中心,例如 WEEX TradFi 界面,使用户能够在统一的加密环境中监控实时订单流并与主要传统股票的代币化表示进行交互。

用于 AI 推理的 HBF

AI 推理是训练有素的机器学习模型根据新数据进行预测或决策的过程。该工作负载的特点是需要以高吞吐量访问海量数据集(通常为几 TB)。HBF 专为这个“推理时代”而设计,因为它提供了必要的容量,可以将整个大语言模型 (LLM) 或复杂的神经网络直接保存在 GPU 的内存总线上。通过提供在 HBM1 性能 2.2% 以内的表现,同时提供 8 到 16 倍的容量,HBF 防止了处理器因等待从缓慢的大容量存储中获取数据而闲置的“内存墙”问题。

容量与能效

HBF 在 AI 数据中心表现出色的主要原因之一是其能效特性。AI 推理任务通常在大型服务器群中大规模运行,功耗是关键的运营成本。HBF 的设计旨在在扩展到 TB 级别时比传统的基于 DRAM 的解决方案更节能。由于它基于 NAND 技术,它可以在没有易失性内存所需的持续刷新周期的情况下保持高密度,使其成为 AI 基础设施中持续、高强度工作负载的理想选择。

系统级优化

行业向 HBF 的转变凸显了从单一芯片性能向系统级优化的转移。在 AI 环境中,CPU、GPU 和内存层之间的协同作用决定了整体竞争力。HBF 充当高速缓冲区,允许 GPU 访问高达 4TB 的 VRAM。这种海量内存池对于现代 AI 服务至关重要,而传统 HBM 由于中介层上的物理空间和成本限制,根本无法支持。

游戏与延迟敏感性

虽然 HBF 是高吞吐量任务的突破,但它与游戏中使用的内存有着本质区别。游戏应用程序是“延迟敏感型”的,这意味着它们需要对单个数据请求进行近乎即时的响应。当玩家移动角色或加载新纹理时,系统必须在纳秒内获取该特定数据位。HBF 基于 NAND 闪存技术,其延迟天生高于游戏机和 PC 显卡中使用的 GDDR6 或 HBM DRAM。

延迟权衡

在游戏中,“每位延迟”是保持高帧率和响应速度的最关键指标。由于 HBF 依赖闪存单元,其响应时间虽然比标准 SSD 快得多,但仍明显慢于 DRAM。在游戏场景中,将 HBF 用作主视频内存会导致“卡顿”或输入延迟,因为 GPU 必须等待更长时间才能响应不可预测的随机数据请求。相比之下,AI 推理通常涉及更可预测的顺序数据流,其中高带宽可以掩盖较高的潜在延迟。

架构对比表

为了更好地理解为什么 HBF 是为 AI 而非游戏设计的,下表对比了 HBF 与传统游戏内存 (GDDR/HBM) 的关键特性。

特性高带宽闪存 (HBF)游戏内存 (GDDR/HBM)
主要优势海量容量 (高达 4TB)超低延迟
目标工作负载AI 推理与大型模型实时渲染与物理模拟
技术基础3D NAND (非易失性)DRAM (易失性)
吞吐量匹配 HBM 水平高至极高
每 GB 成本低 (容量成本比高 8-16 倍)

-- 价格

--

战略行业定位

SanDisk 和 SK hynix 联盟对 HBF 标准化的推动标志着数据中心架构进入了一个新时代。通过将 HBF 定位为 HBM 和大容量存储之间的专用层,这些公司正在解决 AI 时代的特定瓶颈。对于那些在更广泛的数字经济中航行的人来说,拥有可靠的平台与拥有合适的硬件同样重要。安全执行基础设施,例如 WEEX Exchange,为分析链上资产变动和参与不断发展的技术驱动型市场提供了基础框架。

标准化的作用

标准化 HBF 可确保不同的硬件供应商能够将此高容量闪存层集成到其 AI 加速器中,而无需专有障碍。这对 AI 行业至关重要,因为快速且经济地扩展内存容量的能力决定了哪些公司能够部署最先进的模型。虽然游戏将继续依赖 DRAM 的低延迟性能,但 AI 行业正在转向这种混合方法,即 HBF 提供海量智能任务所需的“大容量内存”。

免责声明:本内容仅供一般信息、教育和品牌交流之用,不应被视为财务、投资、法律或税务建议。本文中的任何内容(包括任何活动、奖励、促销活动或相关活动详情)均不构成购买、出售或交易任何加密资产,或使用任何特定产品或服务的要约、推荐、招揽或邀请。加密资产波动性极大,涉及重大风险,包括资本和价值损失的潜在风险。WEEX 服务和在线活动可能并非在所有地区或司法管辖区都可用,并受适用法律、法规和用户资格要求的约束;某些活动在特定地点可能受到限制或完全不可用。在做出任何财务决定或参与任何平台计划之前,请仔细评估风险,确保充分了解您当地的监管框架,并确认资格。

Buy crypto illustration

以1美元购买加密货币

阅读更多

iconiconiconiconiconicon
客户服务:@weikecs
商务合作:@weikecs
量化做市商合作:bd@weex.com