2025年高速铜缆有望新增60亿美元市场
2025年高速铜缆有望新增60亿美元市场
因此实际上GB200 NVL72使用了定制的高密度背板连接器和线颗NVLink Switch的机柜内互联,而为了解Switch tray上PCB密集高频信号的串扰问题,还使用了OverPass近芯片跳线连接到背板。
NVL72 NVSwitch Tray使用了OverPass跳线(图中蓝色线的高速铜连接架构设计。英伟达对于NVL36*2的定位是满足某些机柜功率、风冷散热有限制条件的客户的真实需求,NVL36机柜的最大区别一是同样配置了9个Switch tray(18颗NVLink Switch4芯片),相当于交换容量翻倍,二是是使用了可扩展的NVLINK Switch tray,两台NVL36机柜之间通过短距ACC铜缆互联。对于线背板和交换芯片跳线相同的设计,相应的由于GPU数量减半,线背板和OverPass使用的电缆数量也近乎减半。但由于要实现两台NVL36的互联,每套NVL36*2系统将需要额外的162根1.6T ACC电缆互联,而为了将NVLINK Switch一半的带宽连接到前面板,英伟达还使用了安费诺的Densilink跳线整体上跳线基本相当的。
除英伟达外,高速铜互联在AI短距离场景已有成熟经验,dojo/谷歌等均使用定制铜缆或DAC&AEC作为短距互联方案。以谷歌为例,其TPUv4服务器设计TPU和CPU板卡是分开的,使用PCIE外部线进行连接而在TPU互联域,谷歌使用的是3D torus网络架构,每颗TPUv4具有6*50GB/s ICI带宽,其中2条ICI链路在tray内通过PCB互联,3条链路使用400G DAC铜缆在机柜内与其他TPU tray互联,剩余1条链路通过400G FR4光模块连接OCS光交换机。特斯拉自研芯片dojo机柜的设计则更加独树一帜,其基本芯片单元为D1芯片,25个D1芯片组成一个Training Tile,12个Training Tile组成一个服务器机柜,算力达109PFlops。为实现Training Tile之间的高速互联,特斯拉定制了通信协议,每片Tile的每一边通过10个900GB/s定制连接器和线TB/s的超大带宽。
聚焦铜互联:铜互联主要使用在于芯片间互联及柜内互联等等短距离场景,传输距离通常在10米及以下。铜互连指的是主要使用铜作为材料的电信号通信方式(因其导电导热性能好,可塑性强),因此其涵义其实包括了芯片内互联走线(在芯片制造时实现)、芯片间(chiplet)走线(通常在基板上完成)、模组间走线(在PCB上完成)、PCB板间通信(一般是通过背板、连接器或铜缆完成)以及机框之间通信(一般是通过铜缆或光模块)。
在224Gbps速率下,cable (铜缆)是SERDES LR (米级)最建议的电信号通信方式。随传输速率增加,传统PCB信号衰减程度快速提升,采用增加层数和更换新型材料则会使成本显著提升,因此cable传输代替PCB成为有效解决方案。如图所示,横轴代表信号频率,纵轴代表信号强度(dB负值越大衰减越严重),PCB信号(红色、粉色、黄色)的下降斜率较cable (绿色、蓝色)陡峭的多。根据OIF对SERDES LR的测试数据,在224G速率下,cable可传输1米,是建议的通信手段。
Al Scaleup需要怎样的通信技术?考虑距离、功耗、密度、串扰、成本。Scaleup指的是使用统一物理地址空间将多GPU组成一个“超级GPU”节点,随着大模型参数的快速提升,扩大Scaleup域有助于张量并行效率更加高,并且简化了AI算法编程。NVLINK是英伟达GPU实现Scaleup的主要通信方式,其通过NVLINK Switch实现节点内高速交换。NVLINK Switch 3最高连接8枚GPU,而NVLINK Switch 4最多可扩展576个,GB200 NVL72、NVL36*2的Scaleup域为72个GPU。在8颗GPU互联时,NVLINK主要是通过PCB进行intra-board通信,距离通常在1米内;而72颗GPU互联达到了intra-rack、相邻rack通信,距离通常在1米至5米,因此距离成为GB200选择铜缆互联的最重要的因素。除此之外,与光通信(AOC、CPO)对比,根据TheNextPlatform报告,铜缆的cost成本仅为AOC的十分之一,虽然CPO在功耗、密度、距离都更有潜在优势,但当前产业链还不成熟,其对客户机房改造、服务器设计等“潜在成本”是要高出不少的。
铜缆互联是NVL72&36机柜内、机柜间短距互联的性价比最佳方案。GB200机柜compute tray与Switch tray之间的传输距离约为0.5-1米,英伟达使用了定制化的线背板模组cartridge结合高密度背板连接器来实现背板的互联,较PCB可行度更高、较光模块成本更低。而在Switch tray交换芯片到背板、前面板英伟达则使用了安费诺的OverPass、Densilink近芯片跳线方案,以避免PCB也许会出现的高频信号串扰、信号衰减过快问题。在NVL36相邻机柜间,英伟达或选择有源铜缆ACC方案,较光模块成本更低、功耗更低。
GB200高速铜缆市场分析:预计2025年高速铜缆新增市场近60亿美元。
一是根据英伟达在GTC2024上的介绍,NVL72使用铜缆互联较光模块节省了6倍的成本。
即2*NVL36系统要162条1.6T ACC铜缆,其价值量约为5.3万美金。
根据Trendforce,2025年GB200机柜合并出货有望达到6万台,其中NVL36可能达到5万台。以此为核心假设根据以上价值量测算,得到2025年GB200机柜的铜缆市场将达到约64亿美元。