20240324_中信建投_计算机行业：以太网Infiniband还是NVLink？以及光还是铜？_32页.pdf-资源下载-

报告吧 > 资源分类 > PDF文档下载

阅读全文

20240324_中信建投_计算机行业：以太网Infiniband还是NVLink？以及光还是铜？_32页.pdf

资源ID：169552 资源大小：2.79MB 全文页数：32页
资源格式： PDF 下载积分：9.9金币【人民币9.9元】

快捷下载

会员登录下载

三方登录下载：

下载资源需要9.9金币【人民币9.9元】

邮箱/手机：
温馨提示：	用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）
支付说明：	本站最低充值10金币，下载本资源后余额将会存入您的账户，您可在我的个人中心查看。
支付方式：
验证码：	换一换

加入VIP,下载共享资源

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，既可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

20240324_中信建投_计算机行业：以太网Infiniband还是NVLink？以及光还是铜？_32页.pdf

以太网,Infiniband,还是NVLink？以及光还是铜？证券研究报告行业动态发布日期：2024 年3 月24日本报告由中信建投证券股份有限公司在中华人民共和国（仅为本报告目的，不包括香港、澳门、台湾）提供。在遵守适用的法律法规情况下，本报告亦可能由中信建投（国际）证券有限公司在香港提供。同时请务必阅读正文之后的免责条款和声明。分析师：杨伟松SAC 编号:S1440522120003分析师：刘永旭SAC 编号:S1440520070014分析师：阎贵成SAC 编号：S1440518040002SFC 编号：BNS315分析师：武超则SAC 编号：S1440513090003SFC 编号：BEM208 核心观点以太网 or Infiniband？在传统云计算数据中心领域，以太网技术的产品市占率保持绝对领先的地位；但是在HPC领域，对于网络的性能要求越高，IB 的渗透率越高。我们认为，IB 网络短期内在AI 领域仍然具备较强的优势，但是以太网ROCE的发展也有可能会使得其渗透率有一定的提升。NVLink-Network 或成最终赢家。我们认为NVLink 依靠其数倍于PCIe 的带宽优势，单位算力成本有望具备很强的性价比，或成最终赢家。英伟达采用NVLink-Network 进行超多节点互连的尝试始于GH200，在B 系列GPU 的产品上全NVLink连接的节点数提升超一倍，有望成为未来主力产品。GB200 NVL72是机架级产品，可认为是GH200 NVL32 的升级版。GB200 NVL72若通过IB/以太网搭集群，GPU:1.6T=1:2.5；若通过NVLink-Network 搭576集群，GPU:1.6T=1:9。网络带宽作用凸显，计算效率大幅提升。Copper or Optics？IEEE P802.3df 发布的目标中单通道100Gbps 速率的电信号传输的距离为2m。对于单通道200Gbps 电信号的传输距离，谷歌的在报告中论证过达到1m 的可行性，Intel 认为在优良材料上可达到1m。在GB200NVL72 中，单个差分对预计为200Gbps，Rack 内可传输1m，铜线可以受益。但是到下一代更大带宽的GPU 产品中，我们预计铜线传输距离大大缩短，光学方案将逐步替代。投资建议：英伟达Blackwell 架构的GPU 需求有望持续高速增长，随之带来1.6T 光模块广阔的市场空间，将打消市场对2025 年光模块市场需求的担忧。海外云厂商及算力巨头供应链的进入壁垒较高，光模块更新迭代的节奏大幅加快，光模块的行业格局预计将更加集中，建议重点关注头部光模块及光器件公司，新易盛、中际旭创和天孚通信等。云厂商在提升光模块性能以及降低成本、功耗方面的动力较强。建议关注薄膜铌酸锂、硅光、OCS、LPO 和CPO 等行业新技术的发展，包括源杰科技、光库科技、德科立和腾景科技等公司。WUDWuNsPpMrQpRnOmRtMnM8OcMaQoMpPsQmQfQoOnOfQnPqNaQqQzRNZsOqNxNsPpM三、光还是铜？一、以太网还是Infiniband？四、投资建议目录五、风险提示二、NVLink-Network 或成最终赢家 1.1 以太网 VS Infiniband？在传统云计算数据中心领域，以太网技术的产品市占率保持绝对领先的地位。以太网领域的头部厂商，充分享受云计算快速发展带来的强劲需求，包括博通、Marvell、Arista 和思科等厂商。在HPC领域，对于网络的性能要求越高，IB 的渗透率越高，全球前10 大超算中心，IB 市占率70%。IB 市场上，主要是Nvidia（收购的Mellanox公司）和Intel（收购的Qlogic公司）两大玩家。IB 虽然性能更好，但价格较贵。随着ChatGPT 的横空出世，AIGC 的大模型引爆了算力的需求，大模型的训练对于网络性能要求较高，因此Mellanox 的IB 产品受到了绝大部分客户的青睐。2024 财年四季度，英伟达的网络部分收入增长了两倍，需求保持强劲。虽然IB 的时延具有很大的优势，尤其在训练场景下，但是基于RDMA 的以太网技术ROCE 也保持较低的时延，且成本优势较大，性价比更高。我们认为，IB短期内在AI领域仍然具备较强的优势，但是以太网联盟的发展也会使得其渗透率有一定的提升。图表1：全球TOP10 和TOP100 超算中心采用不同网络技术统计图图表2：超级以太网联盟主要成员资料来源：The Next Platform，UEC，中信建投 esYLXL0g5RNL8MmpGYh4TLzkDSe1RnSOm2svFrHBRVnPe0rDOUgIGnmN1u935qQH 1.2.1 以太网：全球局域网最通用的网络协议标准以太网是目前全球应用最广泛的局域网技术，由IEEE 的802.3 标准制定相关的技术标准。标准中包括了物理层的连接、电信号以及介质访问控制等内容。除了IEEE 标准组织，还有以太网技术联盟（ETC）和超级以太网联盟（UEC）等组织也会发布相关标准。凭借着高可靠性、低成本、易于管理以及高速等优势，以太网技术广泛应用于自动化、自动驾驶、企业网和云计算等领域。以太网起源于Xerox PARC 公司。1976 年，Bob Metcalfe 及其助手发表了以太网：区域计算机网络的分布式数据包交换技术，1977年他们取得了CSMA/CD（Carrier Sense Multiple Access with Collision Detection），即带有冲突检测的载波侦听多址访问的专利，以太网正式诞生。后来Metcalfe 离开施乐公司创立3Com 公司，与英特尔、DEC 和施乐等公司共同将以太网实现了标准化。1980 年，首个通用以太网标准DIX 1.0诞生，随着从总线拓扑走向星型结构化布线以及光缆传输技术的快速发展，以太网迎来了快速发展的时代。图表3：以太网下游应用领域广泛图表4：以太网拓扑结构从总线型走向星型资料来源：Ethernet Alliance，中信建投 1.2.2 以太网：带宽持续提升，调制方式不断丰富通过以太网，用户终端可以与多台终端进行通信。每台终端设备（电脑、手机等）都拥有全球唯一的 48 位 MAC 地址，从而保证以太网上所有节点能互相区分，并且每台终端必须通过物理层介质传输信息，包括无线电磁波或有线电缆等，这些传输通道也被称之为以太（Ether）。物理层硬件也从同轴电缆到双绞线、光纤光缆，NIC 网卡和交换机的出现也加速了以太网的发展。随着下游应用领域的快速发展，带宽的需求也在爆发式增长。IEEE 发布的第一个以太网标准10 BASE5带宽为10M。1995 年，100M 带宽的快速以太网时代开启，1998 年千兆带宽的以太网标准发布，2002 年10G 以太网标准发布。到2020 年，ETC 发布了800G 以太网的标准，预计1.6T 以太网标准也将发布。带宽的不断升级，也带来了调制方式的变化，从NRZ 到PAM4，以及相干QPSK等调制方式。图表5：以太网带宽升级路径图图表6：以太网各种调制方式资料来源：Ethernet Alliance，中信建投 1.3.1 InfiniBand 快速发展，Mellanox市占率全球第一 20世纪90 年代，PCI 升级缓慢导致I/O 遇到瓶颈限制HPC 发展愈发成为重要的问题。HP、IBM、Intel、Mellanox、Microsoft、Oracle和QLogic 等公司于1999 年联合成立Infiniband 贸易联盟（InfiniBand Trade Association），旨在用IB 取代PCI 的I/O、以太网的算力集群互连等。2000 年，InfiniBand 架构规范的1.0 版本正式发布。2002 年，Intel 开始着眼于开发PCI Express，微软终止IB 研发，至2008 年仅剩Mellanox、Cisco、QLogic 和Voltaire 等主要参与者，IB 的发展受到一定的影响。2009 年，思科开始重点研发以太网交换机。2010 年左右，Mellanox 和Voltaire 公司合并，市场上只剩下一个竞争者QLogic。2012 年，Intel收购QLogic 的IB技术，至此，Mellanox 在InfiniBand 领域占据绝对优势地位。2012 年开始，随着HPC 的快速发展，IB 产品需求大增，其市场份额持续扩张。2015 年，IB 在TOP500榜单中占比51.4%，首次超越以太网。在收购硅光技术公司Kotura 和并行光互连芯片厂商IPtronics 后，Mellanox 在全球IB 市场的市占率达80%，成为全球网络领域的领先提供商。2019 年，英伟达以69 亿美元收购Mellanox。图表7:InfiniBand 发展历程1999 20022000 2008 2012InfiniBand 架构规范的1.0版本发布主要参与者仅剩Mellanox、Cisco、QLogic 和VoltaireIntel收购QLogic 的InfiniBand 技术2010 20152019英伟达收购MellanoxIBTA 成立多家企业相继退出InfiniBand 市场Mellanox 和Voltaire 公司合并InfiniBand 产品在TOP500榜单中份额首次超越以太网资料来源：IBTA，中信建投 1.3.2 RDMA 协议降低数据传输时延，SHARP 技术提升计算效率 InfiniBand 最重要的一个特点是采用RDMA协议（远程直接内存访问），从而实现低时延。相较于传统TCP/IP 网络协议，RDMA 可以让应用与网卡之间直接进行数据读写，无需操作系统内核的介入，从而使得数据传输时延显著降低。在大规模并行计算机集群中，低时延能够有效提升算力设施的利用效率。InfiniBand 技术以端到端流量控制为网络数据包收发的基础，能够确保无拥塞发出报文，从而大幅降低规避丢包所导致的网络性能下降的风险。SHARP 技术（可扩展分层聚合和归约协议）的引入使得InfiniBand 系统能够在转发数据的同时在交换机内进行计算，以降低计算节点间进行数据传输的次数，从而大幅提升计算效率。图表8：InfiniBand 采用RDMA协议图表9：SHARP 技术原理示意图资料来源：鲜枣课堂，Nvidia，中信建投 1.3.3 IB 带宽24年可达1.6T，加速AI 发展随着AI 的快速发展，IB 在算力集群发挥着关键的作用。InfiniBand 作为一个用于高性能计算的网络通信标准，其优势在于高吞吐和低延迟，可以用于计算机和计算机、计算机和存储以及存储之间的高速交换互连。HPC 领域对带宽有更高的要求，InfiniBand 目前传输速度达到400Gb/s。根据技术发展路线图，2024年IBTA 计划推出XDR 产品，四通道对应速率800Gb/s，八通道对应速率是1600Gb/s，并将于2年后发布GDR 产品，四通道速率达1600Gb/s。InfiniBand系统的硬件由网卡适配器、交换机、电缆和光模块组成。图表10：InfiniBand 发展路线图图表11：InfiniBand 技术产品示意图资料来源：IBTA，Nvidia，中信建投三、光还是铜？一、以太网还是Infiniband？四、投资建议目录五、风险提示二、NVLink-Network 或成最终赢家 2.1 以太网 VS Infiniband？NVLink-Network 或成最终赢家由于以太网和Infiniband 在数据中心和超算中心有着较长的应用历史以及良好的客户基础，因此在AI 时代，我们通常会谈论这两者之间的竞争。目前Infiniband 得益于更优秀的性能以及英伟达的一体化销售战略，在AI 市场处于绝对领先的地位，但是昂贵的价格以及以太网众多玩家在技术和产品上的持续突破，似乎竞争愈演愈烈。然而，我们认为NVLink 依靠其数倍于以太网和IB的带宽优势，单位算力成本有望具备很强的性价比，或成最终赢家。目前NVLink4.0的双向带宽为900GB/s，单向带宽3.6Tbps（450GB/s），是以太网和IB网络800Gbps带宽的4倍多。英伟达采用NVLink-Network 进行超多节点互连的尝试始于GH200，在B 系列GPU 的产品上全NVLink 连接的节点数进一步提升。超高的互连带宽意味着更短的传输时间以及更高的算力利用效率。而在需求侧，对光模块和交换机等产业链将产生重大的影响。图表12：NVLink 技术发展路线图资料来源：Nvidia，中信建投 2.2 NVLink 初衷取代PCIe，随GPU 同步升级在NVLink 面世前，PCIe 是最常见的高速互连标准之一，广泛用于CPU、GPU 间的高速互连，但是带宽提升的节奏远远低于需求。2003 年，PCIe 1.0 规范发布，支持每通道2.5GT/s（250MB/s）的传输速率，最大总传输速率为4GB/s。经过20 年的发展，PCIE 由1.0 版本迭代至6.0，每通道传输速率提高至64GT/s。然而，PCIe 带宽的提升远远落后于算力的增加，成为算力系统明显的瓶颈。和Infiniband 技术一样，为了应对PCIe 迭代速度缓慢导致GPU I/O 带宽成为整个算力系统的瓶颈，Nvidia 专门研发了NVLink 技术。NVLink用于连接GPU之间以及GPU 与CPU之间，其允许GPU 芯片间以点对点的方式通信，可以突破传统PCIe 互联带宽限制，实现更高带宽、更低延迟的数据互连。随着GPU 的不断升级，NVLink 也在快速迭代，以确保GPU 之间的高速互连。目前H100 的GPU 对应NVLink 4.0技术，而NVLink 5.0 也有望很快发布。资料来源：PCI-SIG，Nvidia，中信建投图表13：PCIe 不同代际技术参数示意图图表14：GPU 与NVLink 同步升级 2.3 NVLink 在2014年推出，NVSwitch 在2018年推出 2014 年，NVLink 1.0 发布，并应用于P100 芯片。NVLink 1.0 一条差分对单向速率为20 Gb/s，每个通道有8 条差分对，拥有4 条通道的P100 的NVLink 1.0 单向传输带宽可达80 GB/s，整个系统的双向带宽则为160GB/s。2017 年，NVLink 2.0推出，其带宽接近NVLink 1.0 的2 倍。两个GPU V100间通过6 条NVLink 通道互连,每条link通道包括8 条差分对，每条差分对的速率提升至25Gb/s，则每条NVLink 单向带宽为25 GB/s，故V100的NVLink 双向带宽从160GB/s 几乎翻倍至300 GB/s。2018 年，为了实现8 颗GPU之间的all-to-all互连，英伟达发布了NVSwitch 1.0产品。NVSwitch 1.0 类似交换机的ASIC芯片，含有18 个端口，每个端口的带宽是50GB/s，双向总带宽900GB/s，用6 个NVSWitch可以实现8 颗V100 的all-to-all连接。资料来源：Nvidia，中信建投图表15：NVLink 1.0 技术应用于P100 上图表16：NVSwitch 1.0 实现V100 all-to-all连接 2.4 NVLink3.0带宽600GB/s，NVLink 4.0达到900GB/s 英伟达于2020 年推出NVLink 3.0 版本，双向总带宽提升至600GB/s，同期发布NVSWitch 2.0 产品。两颗A100 GPU 之间的NVLink 数量增加至12条,每条NVLink 中的差分对为4 条,单条差分对的单向带宽为50Gb/s。8 颗A100芯片与4个NVSwitch 2.0 芯片组合而成DGX A100服务器。2022年，NVLink 升级到4.0版本，NVSwitch 升级至3.0 版本。单条差分对单向带宽再次翻倍至100Gb/s，两个H100芯片从A100的12 条通道提升至18条，双向总带宽提升到900GB/s。同时，Nvidia发布第三代NVSwitch，包含64 个端口。DGX H100服务器由8个H100芯片与4个NVSwitch 3.0芯片组成。图表17：NVLink 发展路线图图表18：NVSwitch 发展路线图资料来源：Nvidia，中信建投2016 2017 2020 2022 2024NVLink 代际 NVLink 1.0 NVLink 2.0 NVLink 3.0 NVLink 4.0 NVLink 5.0NVLink 数量 4 6 12 18 18通道数 32 48 48 36 36单通道带宽 5GB/s 6.25GB/s 12.5GB/s 25GB/s 50GB/s调制方式 NRZ NRZ NRZ PAM4 PAM4总双向带宽 160GB/s 300GB/s 600GB/s 900GB/s 1800GB/s2017 2020 2022 2024NVSwitch 代际 NVSwitch 1.0 NVSwitch 2.0 NVSwitch 3.0 NVSwitch 4.0配套NVLink NVLink 2.0 NVLink 3.0 NVLink 4.0 NVLink 5.0配套GPU 架构 Volta Ampere Hopper Blackwell端口数 18 36 64 72单端口带宽 50GB/s 50GB/s 50GB/s 100GB/s总双向带宽 900GB/s 1800GB/s 3200GB/s 7200GB/s 2.5 NVLink-Network 初尝试，GH200性能大幅提升 2023 年，英伟达宣布生成式AI引擎NVIDIA DGX GH200现已投入量产。GH200 通过NVLink 4.0的900GB/s 超大网络带宽能力来提升算力，服务器内部可能采用铜线方案，但服务器之间可能采用光纤连接。对于单个256 GH200芯片的集群，计算侧1 个GH200对应9 个800G光模块；对于多个256 GH200集群，计算侧1个GH200对应12个800G 光模块。相比较传统的IB/Ethernet的网络，GH200采用的NVLink-Network 网络部分的成本占比大幅增长，但是因为网络在数据中心中的成本占比较低，因此通过提升网络性能来提升算力性价比很高。图表19：DGX GH200 在大模型方面的性能表现图表20：256 颗GH200 的网络连接示意图资料来源：Nvidia，中信建投 2.6 GH200 NVL32为机架级集群，亚马逊为首个云厂商客户 2023 年11 月，在AWS 的Re:Invent大会上，AWS 和NVIDIA 宣布AWS 将成为第一个提供NVIDIA GH200 Grace Hopper 超级芯片的云服务提供商，在Amazon EC2上运行。NVIDIA GH200 NVL32 是针对 NVIDIA GH200 Grace Hopper 超级芯片的机架级参考设计，通过 NVLink 连接，面向超大规模数据中心。NVL32 不但在训练上性能更加优异，而且在推理上也具备显著的优势。NVL32 相比较传统的H100 以太网连接系统方案，在LLM训练上快1.7 倍，在LLM 推理上快两倍，在训练算法训练上快8倍，在图形训练上快6 倍。图表21：GH200 NVL32 在LLM 推理上比传统H100 快两倍图表22：GH200 NVL32 机架级方案资料来源：Nvidia，中信建投 2.7 GH200 NVL32的技术参数介绍图表23：GH200 NVL32 机架示意图资料来源：Nvidia，中信建投GH200：32颗芯片16 个GH200 Tray 盘每个Tray 盘2 颗GH200内存：19.5TBCPU：LPDDR5X 480GB x 32GPU：HBM3e 144GB x 32算力：127PFlops FP8单颗GH200:3.96PF FP8总带宽：28.8TB/s双向采用NVLink 4.0：900GB/sNVLink 4.0:900GB/s双向18 个NVLink，36 个112Gb 通道NVSwitch 3.0：18颗芯片9 个NVSwitch Tray 盘每个Tray 盘2 颗NVSwitch 芯片单颗芯片：64x50G=3.2TB/s物理连接：Cable Cartridge预计单个差分对速率为100Gbps 2.8 2024年英伟达GTC 发布GB200 产品，网络产品带宽均翻倍 2024 年3 月，英伟达在2024 年GTC 大会上推出Blackwell 新一代计算平台。Blackwell 构架B200 GPU 的AI 运算性能在FP8 及新的FP6 上都可达20 petaflops，是前一代Hopper 构架的H100运算性能8 petaflops 的2.5 倍，同时支持全新FP4/FP6格式。英伟达还推出了GB200超级芯片，它基于两个B200 GPU，外加一个Grace CPU。英伟达发布NVLink 5.0 和NVSwitch 4.0。NVLink 5.0具有1.8 TB/s的双向带宽，单条差分对单向带宽达到200Gbps，通道数为18个。NVSwitch 4.0 有72个端口，每个端口有2 个单向带宽200G Serdes的通道，总双向带宽为7.2TB/s，可以支持4 个NVLink。图表24：GH200 NVL32 在LLM 推理上比传统H100 快两倍图表25：GH200 NVL32 机架级方案资料来源：Nvidia，中信建投 2.9 GB200 NVL72也是机架级产品，可认为是GH200 NVL32的升级版图表26：GB200 NVL72 机架示意图资料来源：Nvidia，中信建投GB200：36颗GB20018 个GB200 Tray 盘每个Tray 盘2 颗GB200内存：30.38TBCPU：LPDDR5X 480GB x 72GPU：HBM3e 192GB x 2 x72算力：720PFlops FP8GB200:20PF FP8总带宽：129.6TB/s采用NVLink 5.0：1800GB/sNVLink 5.0:1800GB/s双向18 个NVLink，36 个224Gb 通道NVSwitch 4.0：18颗芯片9 个NVSwitch Tray 盘每个Tray 盘2 颗NVSwitch 芯片单颗芯片双向：72x100G=7.2TB/s物理连接：Cable Cartridge预计单个差分对速率为200Gbps 2.10 GB200 NVL72若通过IB/以太网搭集群，GPU:1.6T=1:2.5 GB200 NVL72为机架级产品，内部72 颗Blackwell 的GPU 通过NVLink 实现互连。由于机架级产品的Tray 盘之间的距离较短，因此可以通过高速电连接器进行连接。若需要搭建千卡甚至万卡级别的集群，GPU 和光模块的比例平均可以认为是1:2.5。如果以GB200 NVL72 为单元，用IB或以太网实现超大规模的集群搭建，若采用Fat-tree 网络架构，那么GPU 和光模块的比例将达到1:2（两层），1:3（三层）。图表27：英伟达以太网和IB 的800Gbps 交换机图表28：Fat-tree 网络架构示意图（为200G 光模块）资料来源：Nvidia，中信建投A100 GPU 200 网卡第一层交换机第二层交换机第三层交换机A100:200G 光模块=1:6同样的，H100:400G 光模块=1:6H100:800G 光模块=1:3 2.11 GB200 NVL72若通过NVLink-Network 搭576集群，GPU:1.6T=1:9 GB200 NVL72通过NVLink-Network搭建成576 只GPU 的SuperPod，可以认为是GH200 256的升级版。在英伟达的官方技术文档中，为客户提供了576只GPU 全NVLink 连接的集群方案，能够以1.8TB/s 的超大带宽实现超大内存的高速共享。若需要搭建576 只GPU 的全NVLink 连接的集群，假设采用fat-tree 的架构，那么GPU：1.6T 的比例可以达到1:9 以上。NVLink5.0的单向带宽为7.2Tbps，若只有一层用光，那么单只GPU 对应的光模块的数量为7.2T/1.6T*2=9。图表29：Fully connected NVLink 576 GPU 的结构示意图（预测）资料来源：Nvidia，中信建投三、光还是铜？一、以太网还是Infiniband？四、投资建议目录五、风险提示二、NVLink-Network 或成最终赢家 3.1 电信号带宽提升，趋肤效应导致传输损耗增加电信号在铜线中传输存在以下几种损耗：导体损耗，随着交流频率升高，电流由于趋肤效应集中在导体表面而不是在导体内部，因此受到的阻抗增大，同时，铜箔表面的粗糙度也会加剧导体损耗；介质损耗，主要是由于介质的极化，介质中的电偶极子极化方向由于交流电场不断变化，能量被不断消耗；耦合到邻近走线，指串扰，造成信号自身衰减的同时对邻近铜线中信号产生干扰；阻抗不连续，反射会导致传输的信号损失部分能量；辐射损耗，虽然辐射引起的信号衰减相对较小，但是会带来EMI问题。图表30：电信号传输损耗分解图图31：信号频率变化的趋肤效应示意图资料来源：CSDN，Eeiq，中信建投电信号传输损耗介质损耗导体损耗耦合至邻线阻抗不连续辐射损耗趋肤效应表面粗糙度*黄色为电传输线，蓝色为电信号 3.2 100Gbps电信号在铜线中传输2m，200G速率预计传输1m 我们认为通信带宽每升级一代，损耗增加，传输距离都要显著缩短。通信带宽提升，趋肤效应导致在铜线和PCB Trace 中传输损耗增加，连接器头子损耗增加，封装Trace 损耗增加，因此有效传输距离将明显缩短。从2022 年11 月IEEE P802.3df 发布的目标来看，单通道100Gbps 速率的电信号传输的距离为2m，而谷歌在2021年的报告中，论证单通道200Gbps 传输距离达到1m 的可行性，仍然需要BGA/via 的优化、Serdes 性能提升等。2021年的Photonics Summit 大会上，Intel 认为单通道200Gbps的电信号若在优良材料上传输，有效传输距离可达到1m。到单通道400Gbps时代，我们预计铜线传输距离将缩短到0.5m，铜线的应用场景将大大受限。图表32：Intel 关于电信号和光信号传输距离的观点图33：谷歌论证200G 单通道采用copper 传输的可行性资料来源：IEEE，谷歌，中信建投 3.2 100Gbps电信号在铜线中传输2m，200G速率预计传输1m（续）图表34：IEEE P802.3df 目标参数示意图资料来源：IEEE，中信建投 3.3 GB200 NVL72虽然铜线短期受益，但光进铜退是大势所趋在GB200 NVL72 中，高速背板连接器中单个差分对预计为200Gbps，Rack 内可传输1m，铜线可以受益。但是到下一代GPU 产品中，我们预计铜线传输距离大大缩短，光学方案将逐步替代。英伟达One Giant GPU的概念，在物理层面上将所有GPU 通过NVLink 连接起来，但铜线可覆盖的物理范围将越来越小，将逐步转为光学方案。由于芯片之间连接的铜线trace 直径太小，因此带宽升级后损耗较大，因此在CPO 领域硅光I/O 的必要性也在大幅增强。因此，我们认为，无论是Tray 盘之间的连接，还是芯片之间的互连，未来光学方案的渗透率都将大幅提升。而短期内光学方案的功耗和成本问题，将会有新技术或新产品来解决，但是底层仍然会是光学方案。图表35：英伟达GPU 中硅光I/O 结构示意图图36：光进铜退逐步渗透到芯片和芯片之间资料来源：Nvidia，Intel，中信建投三、光还是铜？一、以太网还是Infiniband？四、投资建议目录五、风险提示二、NVLink-Network 或成最终赢家投资建议 AIGC 的快速发展带来了算力的爆发性需求，网络在整个AI 数据中心的作用愈发重要，可以显著提升算力的效率。800G光模块的需求大幅提升，1.6T 光模块的量产进程大幅加速，预计将成为2025 年的需求主力。英伟达Blackwell 架构的GPU 需求有望持续高速增长，随之带来1.6T 光模块广阔的市场空间，将打消市场对2025 年光模块市场需求的担忧。海外云厂商及算力巨头供应链的进入壁垒较高，光模块更新迭代的节奏大幅加快，光模块的行业格局预计将更加集中，建议重点关注头部光模块及光器件公司，新易盛、中际旭创和天孚通信等。随着AI 算力基础设施中的网络架构愈发重要，光模块的需求量显著增加，且速率迭代周期加快，云厂商在提升光模块性能以及降低成本、功耗方面的动力较强。建议关注薄膜铌酸锂、硅光、OCS、LPO 和CPO 等行业新技术的发展，包括源杰科技、光库科技、德科立和腾景科技等公司。三、光还是铜？一、以太网还是Infiniband？四、投资建议目录五、风险提示二、NVLink-Network 或成最终赢家风险提示 AIGC 的快速发展，无论训练侧还是推理侧对光模块需求都有较大拉动，若AIGC 发展不及

注意事项

本文（20240324_中信建投_计算机行业：以太网Infiniband还是NVLink？以及光还是铜？_32页.pdf）为本站会员（18709673099）主动上传，报告吧仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知报告吧（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？