20240318_中泰证券_通信行业英伟达GTC专题：新一代GPU、具身智能与AI应用_20页.pdf-资源下载-

报告吧 > 资源分类 > PDF文档下载

阅读全文

20240318_中泰证券_通信行业英伟达GTC专题：新一代GPU、具身智能与AI应用_20页.pdf

资源ID：169146 资源大小：1.69MB 全文页数：20页
资源格式： PDF 下载积分：9.9金币【人民币9.9元】

快捷下载

会员登录下载

三方登录下载：

下载资源需要9.9金币【人民币9.9元】

邮箱/手机：
温馨提示：	用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）
支付说明：	本站最低充值10金币，下载本资源后余额将会存入您的账户，您可在我的个人中心查看。
支付方式：
验证码：	换一换

加入VIP,下载共享资源

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，既可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

20240318_中泰证券_通信行业英伟达GTC专题：新一代GPU、具身智能与AI应用_20页.pdf

证券研究报告 2024 年3 月18日英伟达GTC专题：新一代GPU、具身智能与AI应用1中泰通信首席分析师：陈宁玉（S0740517020004）Email：研究助理：佘雨晴 Email：研究助理：杨雷Email：核心观点GTC2024 召开在即，关注新一代GPU、具身智能、AI 应用三大方向。GTC 2024 将于当地时间3 月18-21 日在美国加州圣何塞会议中心及线上举行，预计发布加速计算、生成式AI 以及机器人领域突破性成果。建议关注三大方向：1）B100 及后续芯片路线。B100 预计采用BlackWell 全新架构，与H200 系列相比性能有望翻倍提升，GB200 或于2024-2025 年推出，芯片迭代周期缩短至1 年，带动配套工艺及组件加速升级。2）具身智能：AgilityRobotics、波士顿动力公司、迪士尼和Google DeepMind 等公司将参加GTC 机器人相关会议，现场将展出25 款机器人。黄仁勋曾表示具身智能是AI 下一个浪潮，2024 年初英伟达投资人形机器人公司FigureAI 并成立通用具身智能体研究实验室GEAR，大会或将更新相关成果。3）AI 应用。本次GTC共有亚马逊、Anthropic、Runway 等1000 多家参会企业，300多家参展商将展示英伟达平台在农业、汽车、云服务等行业的应用。多模态大模型助力AI 赋能下游行业，提升推理侧算力与带宽要求，数据中心、CDN等或将受益AI 应用带来的新一轮流量增长。B100 性能预计大幅提升，GB200 有望超预期。英伟达将推出全新芯片架构BlackWell，或为英伟达首次采用多chiplet 设计的架构。B100 成为首款基于BlackWell架构的芯片，预计为MCM 多芯片封装，台积电N3 或N4P 制程工艺，可能使用CoWoS-L，性能预计至少为H200 的2 倍，H100 的4 倍；首发内存或为200G HBM3e，约为H200 的140%；或采用224Serdes。为了更快推向市场，B100 前期版本或使用PCIe5.0 和C2C 式链接，功耗700W，方便直接沿用H100 的现有HGX 服务器，后续将推出1000W 版本，转向液冷，并将通过ConnectX8 实现每GPU 网络的完整800G。根据英伟达芯片路线图，GB200 将于2024-2025 年推出，由CPU 和GPU 通过NVLinkC2C 连接构成，或采用NVLink5.0 及192GB HBM3e 内存，性能有望超预期提升。聚焦光通信与液冷产业链，关注新技术变革方向。AI芯片加速升级带动光模块、交换机等底层网络硬件迭代提速，2024 年1.6T 需求将现，速率升级同时伴随功耗成本增加等问题，硅光、LPO、CPO、薄膜铌酸锂等新技术方案导入有望加快。国内光模块厂商全球份额过半，市场竞争力较强，带动光通信产业链逐步向国内转移，上游光芯片国产替代预计加速。B100 后续迭代版本功耗或达1000W，GB200 或进一步增长至1200W，英伟达已联合行业伙伴布局混合液冷等创新散热方案。算力器件功耗持续增长对传统风冷带来挑战，AI 算力将导致数据中心能耗不断抬升与PUE 指标趋严将共同倒逼产业对液冷需求升级，冷板式液冷或率先放量，浸没式液冷为长期方向。温控、IDC、服务器、运营商等多方积极部署液冷路线。随着AI 发展，液冷产业链参与者不断增加，上下游协同增强。投资建议：重点关注光模块器件：中际旭创、天孚通信、新易盛、源杰科技、仕佳光子、腾景科技、光库科技、光迅科技、联特科技、太辰光等；液冷：英维克、申菱环境、高澜股份、佳力图、依米康、网宿科技等；ICT设备：菲菱科思、盛科通信、锐捷网络、紫光股份、中兴通讯等；数据中心：宝信软件、润泽科技、光环新网、奥飞数据等。风险提示：AI发展不及预期、技术迭代不及预期、市场竞争加剧、海外贸易争端、市场系统性风险、研究报告使用的公开资料可能存在信息滞后或更新不及时等风险1ZFUzQmRoNnMoQmPqNqPrQ9PaO8OmOqQoMtPlOmMtQiNnMzQ6MpPvMwMpPnRMYsOrQGTC 2024前瞻：见证AI 的变革时刻3来源：英伟达官网，中泰证券研究所 GTC 2022：硬件为主，发布全新Hopper架构H100 GPU 及Grace CPU 超级芯片，第四代NVLink 和第三代NVSwitch 技术、DGX H100 SuperPOD 等。GTC 2023：侧重软件及服务更新，发布及更新H100 NVL GPU，PCIe H100 等硬件，以及AI 超级计算服务DGX Cloud、光刻计算库CuLitho、GPU 加速量子计算系统等。GTC 2024：当地时间3 月18-21 日举行，黄仁勋将发表主题演讲“见证AI 的变革时刻”，发布加速计算、生成式AI 以及机器人领域突破性成果。会议期间将举办超过1000 场演讲、圆桌讨论、培训等各种活动，来自英伟达、Meta、微软、斯坦福等业界及学术界众多权威AI 研究者将参加200 多场会议。共有1000 多家企业将参加本届GTC，包括但不限于亚马逊、OpenAI、微软、Meta、谷歌等AI 巨头以及Anthropic、Cohere、Runway 等AI 初创企业。300 多家参展商将展示企业如何在航空航天、农业、汽车和运输、云服务、金融服务、医疗和生命科学、制造、零售和电信等各行业部署英伟达平台。图表：GTC 2024 会议主题数量分布关注一：Blackwell GPU架构及B1004来源：英伟达官网，中泰证券研究所英伟达有望在GTC 2024 上发布B100及B200 系列。B100 将首次采用Blackwell 架构，基于更复杂的多芯片模块（MCM）设计，与现有采用Hopper 架构的H200 系列相比性能有望翻倍提升，预计使用台积电3nm 或N4P 工艺制程，功耗或达1000W，采用液冷方案，2024Q2/Q3 开始规模生产。此外，根据英伟达最新官方路线图及IT 之家报道，预计2024-2025 年之间推出GB200，或采取差异化策略推动客户采购，加大其与B100/B200之间的配置差距，特别在NVLink 和网络性能方面。B100 预计配套全新组件。此外根据路线图，英伟达将于2024 年底前推出速度更快、功能更强大的 InfiniBand 和以太网 NIC 以及交换机，每个端口的带宽可达 800Gb/s，本次大会上或将有所透露。据 Barro n s 报道，英伟达将于2025 年推出B200 GPU，单张功耗达1000W，升级后的B200 变体可能采用更快版本的HBM 内存，以及更高的内存容量，升级规格和增强功能。图表：英伟达芯片路线图BSMYxGCp0 xNx5VWewcqzSbzkDSe1RnSOm2svFrHBRVmYROSD8syZVz7hIiGkwI5L 关注二：具身智能/人形机器人/自动驾驶5来源：英伟达官网，中泰证券研究所人形机器人：AgilityRobotics、波士顿动力公司、迪士尼和Google DeepMind 等公司将参会，现场将展出25 款机器人，包括人形机器人、工业机械手等。英伟达于2018 年推出包含全新硬件、软件和虚拟世界机器人模拟器的NVIDIA Isaac，同时还推出专为机器人设计的计算机平台Jetson Xavier 和相关的机器人软件工具包，2023 年发布多模态具身智能系统VIMA 和自主移动机器人平台Isaac AMR。同时，英伟达通过仿真模拟平台Omniverse 与AI 结合，帮助建立训练数据集，23 年3 月Omniverse Cloud 托管至微软Azure，以扩大英伟达AI 机器人开发和管理平台Isaac Sim 的接入范围。2024 年2 月英伟达向人形机器人公司Figure AI投资5000 万美元并成立通用具身智能体研究实验室GEAR，人形机器人作为具身智能优良载体，有望迎来加速发展。自动驾驶：2022 年英伟达发布全新一代自动驾驶SoC 芯片Thor，内部拥有770 亿个晶体管，算力高达2000TFLOPS，较此前Orin 提升8倍，计划2024 年量产，极氪将于2025 年搭载首发。图表：英伟达自动驾驶芯片路线图图表：英伟达Isaac AMR 硬件配置图关注三：AI 推理/边缘计算6来源：英伟达官网，Bloomberg，中泰证券研究所 GTC2024 有望更新以太网架构及产品、ASIC 芯片计划等相关信息。英伟达FY2024 数据中心业务收入40%来自AI 推理，AI 在汽车、医疗和金融服务等垂直领域广泛应用，其正在推出全新Spectrum-X 端到端产品进入以太网领域，引入新技术为AI 处理提供较传统以太网高1.6 倍的网络性能。根据路透社报道，英伟达正在建立新业务部门，专注为云厂商及其他企业设计定制芯片（ASIC），包括先进的AI处理器。本次GTC 共有亚马逊、Anthropic、Runway 等1000 多家参会企业，会上将展示英伟达平台在农业、汽车、云服务等行业的应用，英伟达、HuggingFace、Zalando、AWS、微软、Cloudflare、谷歌等将参加AI 推理相关会议。生成式AI 在影视上的应用将被重点展示。中国游戏厂商腾讯、网易，以及传媒巨头奈飞、皮克斯、迪士尼动画工作室等均将参与游戏/传媒娱乐讨论，可能探讨如何利用生成式AI 和路径追踪技术创造更加逼真的虚拟人物和世界，辅助游戏开发和影视制作；Runway、腾讯及Digitrax 等有望介绍其文生图、文生视频模型及其他AI 应用。其他可能被讨论的应用包括3D 内容生成、云端创作游戏等。2 万亿美元可寻址市场（TAM）：英伟达预计随着通用AI 技术发展，目前1 万亿美元数据中心基础设施安装量（可寻址市场，TAM）将在未来五年翻一番。AI 设备有望替换掉所有的传统计算。图表：英伟达在GTC2023 上推出4 款AI 推理平台图表：ASIC 芯片在边缘AI 应用占比提升图表：英伟达1 万亿美元TAM结构BlackWell架构演进7来源：英伟达官网，51CTO，中泰证券研究所英伟达每隔1-2 年提出新的芯片架构以适应计算需求升级。2017 年提出V olta 架构，专注深度学习和AI 应用，并引入Tensor Core，2020 年Ampere 架构在计算能力、能效和深度学习性能方面大幅提升，采用多个SM 和更大的总线宽度，提供更多CUDA Core 及更高频率，引入第三代Tensor Core，具有更高的内存容量和带宽，适用于大规模数据处理和机器学习任务。2022 年发布Hopper 架构，支持第四代TensorCore，采用新型流式处理器，每个SM 能力更强。Blackwell：或为英伟达首次采用多chiplet 设计的架构，一方面可能简化基于Blackwell 架构的GPU 硅片层面生产，最大限度提高小型芯片产量，另一方面，多芯片封装将更加复杂。预计SM 和CUDA 将采用新结构，光线追踪性能等将进一步优化和加强，RT 单元有可能被PT 单元所取代，以实现对Ada Lovelace 架构的性能翻倍。Blackwell 架构GPU 很可能会支持GDDR7 内存，相比GDDR6X 效率更高，鉴于第一代 GDDR7 SGRAM IC 将具有32GT/s 的传输数据速率，采用这些芯片的384位内存子系统将提供约1536 GB/s 的带宽。与Hopper/Ada 架构不同，Blackwell 或将扩展到数据中心和消费级GPU，但消费级场景或将延续单芯片设计，以实现时间可控及低风险。图表：英伟达芯片架构演进 Volta Turing Ampere Hopper 2017 2018 2020 202280 SM SM 32 FP64+64 Int32+64 FP32+8 TensorCore102 92 SM SM SM 64 Int32+64 FP32+8 TensorCore108 SM SM 64 FP32+64 INT32+32 FP64+4 TensorCore132 SM SM 128 FP32+64 INT32+64 FP64+4 TensorCoreNVLink2.0 TensorCore AI TensorCore2.0 RTCore TensorCore3.0 RTCore2.0 NVLink3.0 MIG1.0TensorCore4.0 NVLink4.0 MIG2.0 12nm 211 12nm 186 7nm 283 4nm 800 V100/TiTan V T4/2080Ti/RTX5000 A100/A800/A30 H100/H800B100：性能翻倍，带宽、显存等大幅提升8来源：51CTO，半导体行业观察，中泰证券研究所 B100：预计为MCM 多芯片封装，台积电N3 或N4P 制程工艺，可能使用CoWoS-L，性能预计至少为H200 的2 倍，相当于H100 的4 倍；首发内存或为200G HBM3e，约为H200 的140%；参考历代NVLink 迭代，预计双向带宽有望较H100 接近翻倍，或采用224Serdes。为了更快推向市场，B100 前期版本或使用PCIe5.0 和C2C 式链接，功耗700W，方便直接沿用H100 的现有HGX 服务器，以大幅提高供应链更早提高产量和出货量的能力。后续将推出1000W 版本，转向液冷，并将通过ConnectX8 实现每GPU 网络的完整800G。这些 SerDes 对于以太网/InfiniBand 仍然是 8x100G。虽然每个 GPU 的网络速度翻倍，但基数减半，因为它们仍然必须经过相同的 51.2T 交换机。B100 预计2024H2 规模出货。MorganStanley 预计2024 年英伟达CoWoS 需求量15万片，对应AI GPU 出货量400 万张，其中H100/B100 分别为377 万张/28 万张。图表：英伟达芯片性能参数 V100 PCIe A100 80GB PCIe A800 80GB PCIe H100 80GB PCIe Volta Ampere HopperFP64 7TFLOPS 9.7TFLOPS 26TFLOPSFP32 14TFLOPS 19.5TFLOPS 51TFLOPSFP16 TensorCore 312TFLOPS 756.5TFLOPSINT8 TensorCore 62TOPS 624TOPS 1513TOPSGPU 32/16GB HBM2 80GB HBM2e 80GB HBM3GPU 900GB/s 1935GB/s 2TB/sTDP 250W 300W 300-350W GPU 7 MIG 10GB PCIe PCIe NVLink 300GB/sPCIe 32GB/sNVLink 600GB/sPCIe4.0 64GB/sNVLink 400GB/sPCIe4.0 64GB/sNVLink 600GB/sPCIe5.0 128GB/s 18 GPU NVIDIA 英伟达采用CoWoS-L，驱动先进封装升级9来源：Bloomberg，中泰证券研究所 CoWoS 封装成为英伟达GPU 供应产能瓶颈之一。CoWoS（Chip On Wafer On Substrate）是台积电开发的一种2.5D 先进封装技术，由CoW 和oS 组合，先将芯片通过Chip on Wafer（CoW）的封装制程连接至硅晶圆，再把CoW 芯片与基板（Substrate）连接，整合成CoWoS。根据不同中介层（interposer），CoWoS 封装又分为CoWoS-S/R/L 三种类型。CoWoS-S：应用最为广泛，采用硅作为中介层；CoWoS-R：基于InFO 技术，利用RDL 中介层互连各chiplets；CoWoS-L：使用小芯片（chiplet）和RDL 作为中介层（硅桥），结合了CoWoS-S 和InFO 技术的优点，使用内插器与LSI（本地硅互连）芯片进行芯片间互连，同时用于电源和信号传输的RDL 层提供灵活集成。MorganStanley 预计2024 年全球CoWoS 产能翻倍扩张至32kwpm（千片/月），台积电产能将达到27kwpm，英伟达仍为需求主力。图表：CoWoS-L 图表：CoWoS-S英伟达加快液冷方案布局10来源：大模型之家，中加创新中心，中泰证券研究所英伟达积极与行业伙伴合作创新液冷方案。2022 年推出基于直接芯片冷却技术（Direct-to-chip）的A100 800G PCIe液冷GPU，较风冷版本性能相当，电力节省约30%，单插槽设计节省最多66%的机架空间。2023 年，与Vertiv、BOYD、Durbin、霍尼韦尔等6 家行业伙伴合作打造混合液冷创新方案，将芯片直接冷却、泵送两相（P2P）和单相浸没式冷却集成在带有内置泵和液体-蒸汽分离器的机架歧管中，使用两相冷板冷却芯片，其余具有较低功率密度的服务器组件将浸没在密封的浸没式箱体内，服务器使用绿色制冷剂分别进行两相冷却和浸没冷却。相较当前无法处理高于400W/cm 功率密度的液冷，混合冷却支持服务器机架功率高达200kW，是目前的25 倍，与风冷相比成本至少降低5%，冷却效率提高20%。同时与台积电、高力等合作开发AI GPU 浸没式液冷系统。2024 年3 月，Vertiv 与英伟达专家团队共同针对GPU 型高密数据中心制冷方案进行研发测试并发布实测数据，结果显示冷板液冷和风冷的创新风液混合制冷方案中大约75%的IT 负载可通过冷板液冷技术实现有效冷却，IT 负载从100%风冷转型为75%液冷的方案时，服务器风扇用电量降低最多达到80%，使总体使用效率（TUE）提高15%以上。图表：英伟达A100&H100 液冷方案图表：英伟达混合液冷方案AI算力芯片功耗提升，催化液冷需求11来源：通信世界，英维克，中泰证券研究所冷板式液冷或率先放量，浸没式液冷技术不断优化。液冷技术目前主要包括冷板式液冷、浸没式液冷和喷淋式液冷三种，其中冷板式液冷将服务器芯片等高发热元件的热量通过冷板间接传递给液体进行散热,低发热元件仍通过风冷散热，兼具性能与价格优势，技术相对成熟；浸没式液冷将服务器完全浸入冷却液中，全部发热元件热量直接传递给冷却液,通过冷却液循环流动或蒸发冷凝相变进行散热，散热效率更高，数据中心基础设施中应用比例有望逐步提升，但对冷却液要求严格，在建设改造以及后续管理维护方面成本更高。温控、IDC、服务器、运营商等多方积极部署液冷路线。随着AI 发展，液冷产业链参与者不断增加，上下游协同增强。英维克、申菱环境等领先温控厂商普遍推出数据中心液冷解决方案，润泽科技、科华数据等IDC 厂商积极改造或新建液冷智算中心，新华三、中兴通讯等ICT 设备厂商均推出液冷服务器，以提升自身竞争力，满足客户需求。图表：液冷技术方案对比图表：英维克Coolinside 全链条液冷解决方案 GB200 有望超预期12来源：英伟达官网，信息平权，中泰证券研究所 GB200是将CPU 和GPU 组合的超级芯片，GB200NVL 是超级计算使用的互连平台。根据产业链信息，预计芯片包括1 个Grace CPU 和2个B100 GPU，内存为192GB HBM3e，CPU 和GPU 之间使用NVLink C2C 连接，采用NVLink5.0，NVSwitch 或将突破寻址限制，支持NVLink 连接2500 张GPU 集群。芯片功耗或达1200w，采用混合冷却，预计其中GPU/CPU/网卡/NVLink Switch ASICs 使用液冷，其他组件使用风冷。预计2024-2025 年之间发布，JPMorgan 预期2025 年出货量50万张。GH200：上一代超级芯片，2023 年5 月发布，包含1 个Grace CPU 和1 个Hopper GPU，之间通过900GB/s 的NVLink-C2C 芯片互连，从而使GPU 可以共享CPU 内存，不再需要传统的CPU 至GPU PCIe 连接。与最新的PCIe Gen5 技术相比，GPU 和CPU 之间带宽提高7 倍，互连功耗减少5 倍以上。基于GH200 芯片的DGX GH200 集群，所有256 个GPUs 连接可以访问到累计144TB 内存，较DGX H100 的640GB 提升约230 倍。GH200 对推荐系统提升效果尤其明显。GH200 在LLM 65B 上的推理速度较H100 提升2 倍多，在VectorDB 和DLRM 上较H100 提升5-6 倍。谷歌云、Meta 和微软预计成为首批DGX GH200 用户。图表：英伟达Grace Hopper 超级芯片架构图表：大内存 AI 工作负载的性能比较英伟达下一代GPU 展望13来源：Wccftech，世界先进制造技术论坛，TSMC，中泰证券研究所产品性能进一步加快提升。根据Bloomberg，英伟达可能在2026 年推出下一代数据中心GPU N100，N100 的GPU 芯片数量可能由B100 的2 个增加到4 个，每个芯片的尺寸相似，尽管GPU 芯片总面积可能翻倍，性能跃进将更加显著。N100 预计采用台积电N3E 工艺，晶体管密度或增加50%，芯片内存可能升级到全新一代HBM4。封装设计将同步升级以扩大芯片尺寸，可能加速热压缩键合（TCB）和混合键合技术应用。芯片算力、工艺及互连等组网方案升级将持续带动交换机、光模块等相关硬件创新迭代，LPO、硅光、CPO 等新技术有望加快推进。图表：英伟达数据中心/AI GPU 基础信息图表：台积电工艺制程路线图AI 服务器对光模块弹性测算14来源：A Scalable,Commodity Data Center Network Architecture，英伟达官网，中泰证券研究所测算 BOM 测算：以500 台DGX H800 主机测算，每台搭载8 张GPU&400G IB，“铜线+光模块“方案下，铜线=GPU/2=2000，光模块数量按400G 计算为4000*4=16000 个，考虑800G 二合一，即为8000个，交换机数量=GPU*5/端口数=320 台；全光模块方案，类似上一代计算，2000*800G+4000*400G 光模块替换铜线，总光模块数包括1 万个800G（2.5 倍GPU）和4000 个400G（GPU1：1 对应）BOM（500 DGX H800，8 GPU&IB/SERVER）+GPU H800 4000 GPU H800 4000IB 400G NDR IB 4000 IB 400G NDR IB 4000 400G Server-to-ToR 2000 400G Server 4000 800G Spine/Core switch 8000 800G ToR 2000IB 400G 64port 320 800G Spine/Core switch 8000IB 400G 64port 320图表：Fat-Tree 网络架构BOM（250 DGX A800，8 GPU&IB/SERVER）+GPU A800 2000 GPU A800 2000IB 200G NDR IB 2000 IB 200G NDR IB 2000 200G Server-to-ToR 2000 200G Server-to-ToR 4000 200G Spine/Core switch 8000 200G Spine/Core switch 8000IB 200G 40port 250 IB 200G 40port 250GPU迭代加速1.6T光模块升级15来源：ITPUB，光通信女人，中泰证券研究所光模块趋势向高速率发展。AIGC 等技术的快速发展带来数据量呈指数级增长，设备与设备之间的亦需要更大带宽连接，因此光模块需要向更高带宽发展。现有光模块带宽主要以100G/200G/400G，目前正朝着800G、1.6T 甚至更高的带宽发展。交换机芯片密度的提升有望带来1.6T 加速放量。数据中心交换芯片的演变趋势基本上处于每两年翻一番的快速增长，25.6T 交换芯片用7nm 工艺，51.2T 则需要选择5nm 工艺节点，预计2025 年3nm 工艺节点可实现，并支持交换芯片能实现102.4T 的容量。对于102.T 的交换容量，则需要1.6T 光模块，光口每波长速率需要达到200G。我们预计2024 年1.6T 有望小批量出货，2025 年1.6T 即可进入产业化节点。图表：光模块向高速率发展趋势图表：交换机密度提升带动光模块速率提升光通信：硅光/LPO/CPO 前沿技术方向16来源：光电汇OESHOW，MACOM，鲜枣课堂，光学小豆芽，中泰证券研究所硅光：技术集成化更具优势。硅光方案可继承CMOS 工艺，芯片层面最大程度实现混合集成，在短距、场景、相干光场景应用有望成为主流。硅光方案可大幅节约器件、组装成本，控制占地空间，实现低成本、大规模的光连接，从根本上改变光器件和模块行业。1.6T 时代，多模VCSEL200G 芯片或面临瓶颈，硅光有望替代成为主流方案。LPO：线性驱动可插拨光模块。通过LPO 技术把DSP 替换，使用高线性度、具备EQ 功能的TIA 和DRIVER 芯片（成本上升少许，比传统DSP 解决方案降低功耗、延迟和成本，满足AI 计算短距离、大宽带、低延时要求。400G 光模块中使用7nm DSP,功耗约为4W 占整个模块功耗的50%，DSP 的BOM成本约占20-40%。高线性度的TIA、Driver 芯片作为LPO 技术的核心零部件，目前有Macom、Semtech、美信（已被ADI 收购）等主要供应商，博通也在推进相关产品研发。微软、Meta、AWS都有可能逐步接受LPO 方案。CPO：光电共封装。交换ASIC 芯片和硅光引擎（光学器件）在同一高速主板上协同封装，集中解决散热问题，同时也可以省去很多SerDes 功能，节省功耗，是有望最有潜力实现高集成度、低功耗和低成本的封装方案。但是由于目前的技术与产业链尚不成熟等原因，短期内难以大规模应用。预计从1.6T 开始，传统可插拔速率升级或达到极限，后续光互联升级可能转向CPO 和相干方案。图表：硅光模块结构图表：CPO 结构图示图表：LPO 结构图示算力网络图谱：GTC聚焦光通信与液冷产业链17来源：各公司官网，中泰证券研究所整理/IDC T/R&Cisco HPE Juniper Arista NVIDIA BroadCom Cisco Intel Marvell Finisar Lumentum MOLEX Intel Finisar Oclaro Broadcom Finisar Lumetum BroadCom AIOT重点关注标的18来源：Wind，中泰证券研究所 GTC 大会召开在即，预计将在本次大会上推出Blackwell 架构的B100 GPU，与H200 系列相比性能有望翻倍提升，后续版本功率或达1000W，采用液冷散热。随着B100 等芯片算力持续提升，光通信产品有望朝高速率进一步演进，成本与功耗瓶颈有望加速硅光/LPO/CPO 等新技术方案落地。建议关注光通信与液冷产业链。同时，本次GTC 大会将围绕机器人、数据中心云计算等多领域开展主题演讲、讨论交流等活动，现场将展出25 款机器人，有望发布具身智能相关进展。大模型向多模态演进，加速AI 应用落地，数据中心、CDN 等或将受益推理场景拓宽带来的新一轮流量增长。图表：重点标的估值 PE2023E 2024E 2023E 2024E 300308.SZ 中际旭创 177.36 1423.89 21.81 78.19%40.26 84.60%65.29 35.37 300394.SZ 天孚通信 156.01 616.06 7.30 81.14%12.11 65.91%84.40 50.87 688498.SH 源杰科技 162.00 138.45 0.19-80.58%1.06 442.61%710.73 130.98 300502.SZ 新易盛 76.98 546.50 6.91-23.57%12.58 82.14%79.13 43.45 688313.SH 仕佳光子 11.65 53.45-0.48-174.21%0.81 269.76%-112.03 65.99 688195.SH 腾景科技 27.08 35.03 0.42-28.34%0.75 80.21%83.72 46.46 300620.SZ 光库科技 51.03 125.18 0.73-37.92%1.56 113.75%171.18 80.09 002281.SZ 光迅科技 39.91 316.97 5.82-4.41%7.37 26.75%54.50 43.00 301205.SZ 联特科技 109.22 141.71 0.62-45.26%1.82 193.55%228.56 77.86 300570.SZ 太辰光 42.19 97.04 1.68-6.80%2.60 55.13%57.83 37.28 002837.SZ 英维克 33.85 192.43 3.89 38.78%5.23 34.55%49.47 36.77 872808.BJ 曙光数创 53.37 106.74 1.05-10.61%1.84 76.16%102.14 57.98 301018.SZ 申菱环境 27.82 74.02 2.27 36.51%3.04 34.00%32.61 24.34 300499.SZ 高澜股份 13.82 42.19 0.38-86.93%1.76 369.33%112.49 23.97 603912.SH 佳力图 8.16 44.21-300249.SZ 依米康 7.92 34.89-300017.SZ 网宿科技 10.10 246.16 5.13 169.00%5.61 9.33%48.01 43.92 ICT 301191.SZ 菲菱科思 95.62 66.30 1.72-11.79%3.21 86.63%38.55 20.66 688702.SH 盛科通信-U 42.34 173.59-0.20 0.0000 0.13 161.67%-854.31 1385.30 301165.SZ 锐捷网络 39.95 226.99 5.12-6.92%7.34 43.47%44.34 30.91 000938.SZ 紫光股份 23.17 662.68 22.64 4.90%28.08 24.05%29.28 23.60 000063.SZ 中兴通讯 29.00 1285.41 93.26 15.41%106.45 14.15%13.78 12.08 300442.SZ 润泽科技 25.10 431.86 17.93 49.67%23.25 29.67%24.09 18.57 600845.SH 宝信软件 42.86 869.59 26.36 20.59%33.04 25.34%32.99 26.32 300383.SZ 光环新网 9.87 177.42 7.16 181.36%9.24 29.05%24.78 19.20 300738.SZ 奥飞数据 9.88 94.21 1.78 7.74%2.56 43.67%52.78 36.74*注：以2024 年3 月15 日收盘价计算，橙底加粗标的为已覆盖公司，盈利预测来自中泰预测，中际旭创/天孚通信/源杰科技/中兴通讯2023 年归母净利润来自业绩快报及年报，其余标的盈利预测及估值均取自Wind 一致预期风险提示19 AI 发展不及预期风险。AI 是底层算力增长核心驱动力之一，若AI 技术及应用发展不及预期，算力规模增速可能放缓，进而影响产业链扩张升级；技术迭代不及预期风险。技术升级带动硬件价值量提升，打开增量市场，若行业技术迭代速度不及预期，可能导致新品导入量产放缓，公司若不能及时根据市场需求变化进行技术、产品及业务创新，市场竞争力将可能被削弱，影响经济效益；市场竞争加剧风险。竞争从业务布局、核心技术、人才、资金和政策等方面展开，存在新的进入者导致市场竞争加剧的风险；海外贸易争端风险。中美之间经贸磋商不断反复，需要保持高度关注；市场系统性风险。全球和国内宏观层面相关因素仍可能对市场产生系统性影响；研究报告使用

注意事项

本文（20240318_中泰证券_通信行业英伟达GTC专题：新一代GPU、具身智能与AI应用_20页.pdf）为本站会员（18709673099）主动上传，报告吧仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知报告吧（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？