AI推理瓶颈,正在从算力转向数据流动
过去几年,AI行业最关注的是GPU性能。从A100到H100,再到GB200和Rubin平台,GPU算力持续提升,大模型训练和推理能力不断突破。但随着模型规模越来越大,一个新的问题开始出现。GPU越来越强,数据却越来越跟不上。在实际AI推理场景中,大量时间并不消耗在计算本身,而消耗在数据搬运、协议处理、网络通信以及存储访问等环节。这也是为什么越来越多AI基础设施厂商开始将目光投向DPU。DPU正在从辅助角色走向核心角色。
GPU+DPU融合成为新一代架构
根据最新行业研究,DPU已经能够承担I/O Offloading、协议卸载、流量整形、模型预处理等任务。
简单来说:GPU负责计算;CPU负责调度;DPU负责数据流转。这种GPU+DPU协同架构正在成为AI推理基础设施的新范式。数据显示,采用GPU+DPU融合方案后,系统响应时间可从150ms下降至80-100ms,CPU利用率降低40%以上。对于大规模推理集群而言,这种优化带来的价值远超单纯提升GPU性能。未来AI竞争的核心,不只是算力竞争,更是数据流动效率的竞争。
AI推理升级背后,PCB正在同步升级
当GPU与DPU开始深度融合,系统结构也变得更加复杂。传统服务器更多是单芯片或双芯片协同。
而新一代AI推理平台往往采用GPU、DPU、CPU以及高速网络模块协同运行。这意味着PCB需要承担更多互联任务。
高速信号数量成倍增长,PCB层数持续提升。同时,为满足高速数据交换需求,PCB对阻抗控制、信号完整性以及串扰控制提出更高要求。过去普通服务器主板能够满足需求的设计方案,在异构计算时代已经逐渐失效。高密度互联、高速背板以及先进封装配套PCB,正在成为新的技术门槛。
刚柔结合板迎来新的应用机会
除了高层数PCB之外,刚柔结合板也开始在异构计算平台中获得更多应用。随着系统空间利用率要求提升,大量高速连接开始采用柔性互联方案。刚柔结合板不仅能够减少连接器数量,还能够提升系统可靠性和空间利用率。在高性能计算平台中,越来越多模块之间的连接正在从传统线缆转向柔性互联结构。
这也推动刚柔结合板需求持续增长。对于PCB企业而言,刚柔结合板能力已经逐渐成为进入高端AI硬件市场的重要门票。
聚多邦如何助力异构计算平台落地?
面对GPU+DPU融合带来的新需求,聚多邦持续布局高端PCB与PCBA制造能力。在高密度多层板、刚柔结合板、高速信号PCB以及阻抗控制领域不断投入。通过DFM前置评审机制,提前发现高速布线、埋盲孔设计、层叠结构等潜在风险,帮助客户降低研发成本和试错周期。同时,聚多邦提供PCB制板、元器件配套、SMT贴装以及整机组装的一站式服务。从样机验证到批量生产,实现设计与制造协同推进,加快客户产品导入速度。对于AI服务器、智能网卡、DPU平台以及高性能计算设备客户而言,这种协同能力正在变得越来越重要。
结语
GPU+DPU融合架构的出现,正在重塑AI推理基础设施。当行业竞争从单纯算力竞争升级为系统效率竞争时,高速互联能力成为新的关键。而支撑这一切的,正是隐藏在服务器内部的高端PCB系统。未来,随着异构计算持续普及,高层数PCB、刚柔结合板以及高速背板需求将进一步增长。对于PCB行业而言,这不仅是一次技术升级,更是一轮新的市场机遇。