2021年中国数据处理器行业概览.pdf
1 2021年中国数据处理器行业概览 2021 China Data Processing Unit Industry Research Report 2021年中国 DPU 業界概要 w w w 报告提供的任何内容(包括但不限于数据、文字、图表、图像等)均系 头豹研究院独有的高度机密性文件(在报告中另行标明出处者除外)。 未经头豹研究院事先书面许可,任何人不得以任何方式擅自复制、再造 、传播、出版、引用、改编、汇编本报告内容,若有违反上述约定的行 为发生,头豹研究院保留采取法律措施,追究相关人员责任的权利。头 豹研究院开展的所有商业活动均使用“头豹研究院”或“头豹”的商号、商标 ,头豹研究院无任何前述名称之外的其他分支机构,也未授权或聘用其 他任何第三方代表头豹研究院开展商业活动。 概览标签 :CPU、DPU、芯片异构、数据中心 报告主要作者:张顺 2021/062 DPU产品最初主要游有一定市场和技术储备的成熟网络设备生产商以及芯片巨头 提供,包括Mellanox,Netronome,Broadcom,Cavium。随着数据流量的暴涨以 及CPU算力瓶颈的凸显,中小企业亦开始布局DPU市场,例如BittWare与Ethernity 等。DPU市场处于早期阶段,技术路线与产品形态均不明确,中小企业试错成本 高,难以迅速发展。云计算厂商巨头包括亚马逊以及华为云通过收购优质的DPU 企业或自研DPU用于自身部署。 DPU市场处于早期阶段,技术路线与产品形态不清晰,中小企业 失试错成本高 01 DPU价格是传统网卡的5倍左右,成本较高,导致目标客户群体较窄。DPU产品的 高意向客户群体具备两大特征:(1)服务器数量多(30万以上),通过DPU释放 CPU的算力可带来巨大的经济收益;(2)对数据传输速率要求严苛。同时满足以 上两个条件的企业主要包括大型的互联网企业以及云计算厂商。DPU并非是中小 企业的刚需产品。中小企业对数据与网络的要求相对较低,会优先考虑传统的网 卡或者软件加速方案。 DPU成本高,云计算厂商与大型互联网企业是DPU市场的高意向 客户 02 国际DPU市场上,英伟达、英特尔以及博通均推出了多款产品,数据的传输速率 以及存储的读写速率分别达到40Gbps以及32Gbps。中国本土DPU企业起步较晚, 数据的传输速率以及存储的读写速率分别为10Gbps与8Gbps,与国际头部厂商有 着1-2代的技术差距。同时,本土企业DPU商用化不足,在性能上以及可靠性上都 无法满足当代云计算厂商的需求。 在DPU市场,国际芯片巨头领先中国本土企业1-2代 03 后摩尔定律时代,CPU计 算能力增速滞后网络传输 速率,激发DPU市场需求 在自2015年起,CPU频率趋于稳定。数据中心提升算力 的边际成本显著提高。然而,应用的激增使得当代数据 中心中的网络流量以每年25%的速度急剧增长。为了适 应这种巨大的流量增长,数据中心网络向高带宽和新型 传输体系发展,其网络传输速率迈向100Gbps,且快速 向200Gbps与400Gbps发展。数据中心算力提升遭遇瓶 颈,难以匹配快速增长的网络传输速率,激发了DPU需 求。此外,CPU适合于处理串行的复杂指令操作,对大 量并行的固定模式的计算并不适用,例如网络传输的协 议栈(TCP/IP)。DPU的出现一方面更好地执行网络传 输的协议栈,提升传输效率,另一方面也可以降低CPU 负荷,让CPU更有效地处理业务数据。 摘要 2021 LeadLeo 400-072-55883 2021 LeadLeo 400-072-5588 名词解释 - 07 行业综述 - 08 定义 - 09 分类 - 10 技术路线 - 11 产业链分析 - 12 商业模式分析 - 18 中国初期企业商业模式 - 19 国际巨头商业模式 - 20 市场规模分析 - 21 中国DPU市场规模 - 22 全球DPU市场规模 - 23 驱动因素分析 - 24 数通市场驱动 - 25 电信市场驱动 - 27 自动驾驶驱动 - 28 政策驱动 - 29 竞争格局分析 - 30 国际市场 - 31 中国市场 - 33 方法论 - 34 法律声明 - 35 目录 CONTENTS4 Terms - 07 Overview of 5G DPU Industry - 08 Definition - 09 Classification - 10 Technical Route - 11 Industry Chain Analysis - 12 Business Model Analysis - 18 China Early Corporates Business Model - 19 International Giant Business Model - 20 Market Size Analysis - 21 China DPU Market Size - 22 Global DPU Market Size - 23 Market Drivers Analysis - 24 Data Communication Market - 25 Telecom Market - 27 AutoDrive - 28 Policy - 29 Competitive Landscape Analysis - 30 International Market - 31 China Market - 33 Methodology - 34 Legal Statement - 35 目录 CONTENTS5 2021 LeadLeo 400-072-5588 DPU:Data Processing Unit,数据处理器,其核心是通过协处理器协助主控CPU处理网络负载,编程网络接口功能 摩尔时代:摩尔定律是由英特尔(Intel)创始人之一戈登摩尔(Gordon Moore)提出来的。其内容为:当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月 便会增加一倍,性能也将提升一倍。换言之,每一美元所能买到的电脑性能,将每隔18-24个月翻一倍以上。这一定律揭示了信息技术进步的速度。 FPGA:FPGA(FieldProgrammable Gate Array),即现场可编程门阵列,它是在PAL、GAL、CPLD等可编程器件的基础上进一步发展的产物。它是作为专用集成电路 (ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。 ASIC:ASIC芯片是用于供专门应用的集成电路(ASIC,Application Specific Integrated Circuit)芯片技术,在集成电路界被认为是一种为专门目的而设计的集成电路。 EDA:电子设计自动化(英语:Electronic design automation,缩写:EDA)是指利用计算机辅助设计(CAD)软件,来完成超大规模集成电路(VLSI)芯片的功能设计、 综合、验证、物理设计(包括布局、布线、版图、设计规则检查等)等流程的设计方式。 VxLAN:是一种网络虚拟化技术,可以改进大型云计算在部署时的扩展问题,是对VLAN的一种扩展。VXLAN是一种功能强大的工具,可以穿透三层网络对二层进行扩展。 它可通过封装流量并将其扩展到第三层网关,以此来解决VMS(虚拟内存系统)的可移植性限制,使其可以访问在外部IP子网上的服务器。 OVS: Openvswitch是一个虚拟交换软件,主要用于虚拟机VM环境,作为一个虚拟交换机,支持Xen/XenServer,KVM以及virtualBox多种虚拟化技术。在这种虚拟化的 环境中,一个虚拟交换机主要有两个作用:传递虚拟机之间的流量,以及实现虚拟机和外界网络的通信。 Infiniband:直译为“无限带宽”技术,缩写为IB,是一个用于高性能计算的计算机网络通信标准,它具有极高的吞吐量和极低的延迟,用于计算机与计算机之间的数据互 连。InfiniBand也用作服务器与存储系统之间的直接或交换互连,以及存储系统之间的互连。 NFVI:网络功能虚拟化基础设施解决方案,是用来托管和连接虚拟功能的一组资源。具体来说就是,NFVI是一种包含服务器、虚拟化管理程序(hypervisor)、操作系 统、虚机、虚拟交换机和网络资源的云数据中心。 VNF:虚拟网络功能,其被看作是NFV的关键。VNF在基础设施层提供的服务是NFV的主要运营目标,这意味着前者左右着网络虚拟化的前景。 UPF:User Plane Function,用户面功能,为 5GC 的基本组成部分。 MEC:边缘计算技术(Mobile Edge Computing)是ICT融合的产物,同时成为支撑运营商进行5G网络转型的关键技术,以满足高清视频、VR/AR、工业互联网、车联网 等业务发展需求。 名词解释6 2021 LeadLeo 400-072-5588 行业综述 01 02 05 03 047 2021 LeadLeo 400-072-5588 中国DPU行业综述本质:DPU市场萌发及DPU核心作用 DPU市场双向推手: 1、CPU算力相对网络传输速率的差距持续扩大,激发网络侧专用计算需求; 2、DPU结构和产品形态灵活,承载多元功能(虚拟交换、存储、数据、网络加密等),术业可专攻 DPU产线萌生:网络侧专用算力需求+供给侧CPU算力瓶颈难突破 数据中心网络向高带宽和新型传输体系发展,其网络传输速率迈向25Gbps,且快 速向100Gbps发展。数据中心算力提升遭遇瓶颈,难以匹配快速增长的网络传输 速率,激发DPU需求。此外,CPU相对更适合处理串行的复杂指令操作,对大量并 行的固定模式计算并不适用,例如网络传输的协议栈(TCP/IP)等。 DPU工作原理(网络传输运算)与传统网卡工作原理对比 DPU工作本质在于任务转移:网络堆栈算法转移+传输协议运算转移 网卡 PClex Core Core Core Core Core Core Core Core Core Core Core Core 安全 网络 传输 存储 Host CPU Core Core Core Core Core Core Core Core Core Core Core Core Host CPU PCle 安全 存储 网络 DPU DPU本质作用在于承载网络侧专用性的网络堆栈算法和传输协议运算转移, 核心效用在于释放CPU算力资源、助力其他计算模块高效处理业务数据。 相对而言,传统网卡仅负责数据链路的传输,故而CPU承担存储、数据、 网络加密等繁杂事务,占用大量业务计算资源。 CPU主频算力相对网络数据传输速率升级的差距 单位: CPU主频算力GHz 数据传输速率Gbps 10Gbps 25Gbps 100Gbps CPU计算能力滞后, 激发专用性的网络 数据传输需求 催生DPU产线 2015 2019 2022 2025 CPU主频算力 2025年算力差距: 或60Gbps 任务转移 来源:头豹研究院8 2021 LeadLeo 400-072-5588 中国DPU行业综述分类:DPU核心处理器+DPU主流产品形态 理论角度:DPU可基于FPGA、MP(Multi-core,MP)与ASIC三类核心处理器进行设计; 产品实现角度:已商用的DPU产品形态包括“ASIC+GP”(NVIDIA等采用)、“ASIC+NP”(华为等采用) 基于不同核心处理器的DPU类别及其特点 供应商自用/市场商用情况 总体优势 总体劣势 低能耗:逻辑单元丰富,支持对数据快速的 并行处理,能耗开销相对ASIC处理器、MP处 理器减少约50%。 基于FPGA 设计的DPU 基于ASIC 设计的DPU 基于 SoC-NP 基于 SoC-GP 高复杂性:FPGA对应的硬件编程语言复杂度 较高,需要高效编程框架(如ClickNP)支持; 高成本:FPGA价格昂贵,数据中心大量部署 将显著拉高成本。 基于MP 设计的 DPU 高性价比:在预定义范围内对数据平面进行 可编程处理,并提供有限范围内的硬件加速 支持,如批量使用等。 中国初创供应商处于实验阶 段,境外头部供应商已自研、 自用基于FPGA的DPU(如 Intel、微软等)。 低可编程性:基于ASIC的DPU性能最强但可 编程性最差,在成熟的应用场景可发挥算力 优势,但缺乏可编程的灵活性将限制其在新 应用场景的渗透。 业界部分头部厂商推出基于 “A S I C + G P ”的D P U,例如 Mellanox(被NVIDIA收购) 的BlueField系列,解决ASIC 可编程性不足以及GP性能不 足的问题,寻求灵活性与性 能之间的平衡点。 性能 表现 差异化技术路径满足用户差异化需求:基于FPGA、MP、ASIC的DPU在性能、成本、可编程性等方面的表现存在较大差异,供应商可通过不同处理器组合的技术路径, 实现单点突破的产品模式,或寻求不同需求点之间的平衡。 可编程性 SoC-GP: 通用处理器 SoC-GP: 网络处理器 SoC-GP SoC-NP 排序原因: NP并行数据处理速 度领先GP,但两者 的性能均不及基于 FPGA的性能。 FPGA SoC-GP SoC-NP FPGA 来源:头豹研究院9 2021 LeadLeo 400-072-5588 中国DPU行业综述实现:供应商实际技术路线选择 整体技术路线:云数据中心流量高速增长,软件加速、嵌入式CPU加速方案将逐渐被DPU替代;FPGA与 SoC是DPU主流的技术路线,在性能、成本以及灵活性上实现了较为理想的平衡 DPU成为各大头部厂商的新赛场 DPU是网卡与处理器的结合,具备传输与计算的能力。早期,Intel为对抗异构芯片(CPU+专用芯片)的趋势,推出了软件加速(SR-IOV、DPDK)与嵌入式CPU的加速方案。软件加速与嵌入 式CPU都存在性能上限,无法满足当前数据中心需求,因此逐渐被DPU替代。 嵌入式CPU逐渐被DPU替代,削弱了Intel在服务器处理器的市场份额以及影响力;服务器处理器有望形成DPU、GPU、CPU三足鼎立的状态;NVIDIA通过收购Mellanox积极布局DPU,抢占市场。 凭借在GPU的绝对优势以及未来DPU的发力,NVIDIA有望在服务器处理器三大芯片中占据其二,替代Intel的霸权地位。 DPU、软件加速与嵌入式CPU加速方案对比 头部厂商DPU技术路线 软件加速与嵌入式CPU加速方案性能不足,逐渐被DPU替代 代表产品 核心处理器 发布时间 NVIDIA (Mellanox) BlueField ASIC+GP 2018 Innova FPGA 2016 ConnectX-6 ASIC 2018 Intel N5010 FPGA 2020 Broadcom Stingray GP-SoC 2018 NetXtreme ASIC 2015 微软 SmartNIC FPGA 2015 SD100 GP-SoC 2017 华为 IN200/300 NP-SoC 2018 核心 处理器 性能 (吞吐量) 研发成本 售价 软件 编程 灵活性 易用性 DPU FPGA 800Gbps 100 Man Year 500$ 中等 较高 困难 ASIC 4T bps 100 Man Year 2000$ 低低较 难 SoC-NP 400Gbps 20 Man Year 300$ 较高 较高 较难 SoC-GP 400Gbps 20 Man Year 300$ 高高简 单 软件加速 40Gbps 10 Man Year 50$ 高高中 嵌入式CPU 100Gbps 10 Man Year 100$ 高低中 来源:头豹研究院10 2021 LeadLeo 400-072-5588 中国DPU行业综述产业链图谱(以DPU解决方案为中游核心产品线) 上游 中游 下游 数通市场 电信市场 其他 软 件 侧 EDA IP核 Synopsys、Cadence、Mentors约占全球80%EDA市场份额 IP商提供许可、版税2种模式,其中版税占据较大份额 ARM是全球IP核市场的龙头企业,市占率为40.8% I P 核 硬 件 侧 制造/封测 制造、封测对应FPGA、ASIC等底层芯片产出,为DPU 硬件产品供应商提供基础组件 FPGA类的可编程器件对流片需求较少,对上游代工厂 依赖度较低,核心需要专业设计软件、算法架构支持 DPU供应商:基于FPGA 以赛灵思为例,该类供应商具备丰富的FPGA设计经验 全球范围而言, 超过50%DPU产线在早期研发阶段采用基于 FPGA的研发方案。中国本土范围而言,90%的初创型DPU 产线于早期研发阶段以FPGA为基础进行产品设计、测试 DPU供应商:基于ASIC DPU供应商:基于NP-SoC DPU供应商:基于GP-SoC 国际巨头芯片厂商推出的DPU产品功能与性能领先中国 本土头部芯片企业1-2代 数通市场 电信市场 随着5G核心网以及边缘计算的云化部署,DPU在电信市场 的渗透率有望持续提高 数通市场是DPU最大的应用市场,具备较成熟的硬件加速解 决方案,以应对云计算带宽、算力面临的压力 自动驾驶市场: 一辆智能驾驶 汽车可作为1个小型数据中心, 每辆智能驾驶汽车配备至少1 块DPU AI服务器市场: 以DPU为中心, 调度管理异构AI神经网络平台; DPU可作为神经网络加速器 FPGA 中国DPU行业下游市场发展成熟,数通市场需求扩容速度最快,电信市 场存在潜在底层需求,或驱动下一轮数通市场对DPU需求释放 云 与 计 算 领 域 通 信 领 域 注:当前市场以FPGA处理器为核心的DPU产品形态居多,但 FPGA成本高昂,难以提升渗透率 ASIC SoC DPU产线向上游采购三类处理器,采购方式包括外购、同厂跨部门采 购等,DPU产线基于底层处理器开发更为专用的计算、传输等功能 来源:头豹研究院11 2021 LeadLeo 400-072-5588 中国DPU行业综述产业链上游(1/2) 上游EDA软件服务: DPU产线上游EDA市场已在全球范围形成较为成熟、全面、分工明晰的产品线, EDA三巨头已通过兼并购形成壁垒。中国本土EDA厂商可通过行业资源整合、定制化产品路线突围 全球范围:EDA市场高度集中,产品线分化明晰,国产替代是趋势 Synopsys部分收购事件,2009年-2019年 EDA全产线覆盖难度极高,美国EDA供应商垄断全球EDA软件市场 突破垄断:整合行业资源是突破美国封锁的关键 平均营收 10亿美元 平均收入 2,000万美元 中国本土EDA企 业收入与国际 巨头差距明显 全 球 E D A 市 场 : 头 部 企 业 垄 断 本 土 E D A 头部垄断企业共同特征:产品线完整,在细分领域拥有绝对优势 绝对优势领域 逻辑综合工具 时序分析工具 Synopsys 位例全球第一(2020) 模拟/混合信号 定制化电路 版图设计 布局布线工具 Mentors 市占率最高(2020) Cadence 市占率最高(2020) 具有模拟集成电路设计全流程系统工具、SoC 集成电路设计与晶圆生产制造所需的部分工具 绝对优势可能方向:高度定制化电路设计 中国企业可效仿美国企业,通过横向并购完善产业布局,扩宽产品线及加强技术; 亦可通过纵向并购整合上下游资源,产生协同效应。 时间 事件 备注 2009 收购MIPS公司的模块业务Chipidea 模拟IP 2010 收购Optical Research Associate 致力于强半导体制造方面光学技术 2012 收购Eve 致力于硬件加速仿真器解决方案 2012 收购Luminescent Technologies 致力于生产掩模处理业务 2012 收购Magma Design Automation 致力于全流程EDA工具 2012 收购SpringSoft 致力于纠错与全定制技术 2017 收购Black Duck Software 致力于开源软件的安全和管理 2018 收购Kilopass 内存IP供应商 2019 收购DINI Group 致力于FPGA电路板和解决方案领域 频繁并购是三巨头掌控市场的通用手段。Synopsys通过滚动并购的操作实现扩大业务规模、 技术整合、抢占市场份额的目的。Synopsys在2008年超越Cadence成为全球最大的EDA工具 厂商。Cadence与Mentor同样通过频繁收购各细分市场的优秀公司提升自身实力。 来源:头豹研究院12 2021 LeadLeo 400-072-5588 中国DPU行业综述产业链上游(2/2) 上游IP核授权:DPU采用10/14纳米先进工艺,集成的IP数量多,设计成本高;在NPU、BPU等专用产 线,中国IP核市场取得突破,在CPU、GPU等通用处理器市场,中国IP核积累不足 DPU采用10/14nm工艺(先进工艺,可集成的IP数量显著增加,设计难度升级) 不同工艺节点芯片设计成本 不同工艺节点下芯片集成的IP数量(平均值) 中国IP企业在处理器IP环节发展滞后 随着先进制程的演进,线宽的缩小使得芯片中晶体管数量大幅提升,单颗芯片中可集成的IP数 量也因此大幅增加。 IP可帮助降低芯片的开发难度、缩短芯片的开发周期并提升芯片性能。随 着先进工艺的升级,IP核数升级为芯片设计厂商带来的收益呈现边际递减趋势。中国IP产业发 展滞后,难以为中游DPU设计厂商提供有力支持,限制DPU新兴市场的发展。 中国IP产业目前已实现在接口IP细分领域的国产替代,但在 处理器类芯片的IP产出较少。在人工智能芯片领域,以寒武 纪为代表的本土厂商在NPU IP细分市场已有较强的影响力; 地平线在BPU IP细分市场取得重大突破。 10 14 20 28 29 50 64 81 102 126 4 5 11 19 27 37 49 62 76 92 0 20 40 60 80 100 120 140 160 180 200 220 240 数字IP 模拟混合IP 单位:个 DPU 制程范围 28 36.6 52.2 57.1 99.6 162.1 270.3 497.6 0 200 400 600 65nm 40nm 28nm 22nm 16nm 10nm 7nm 5nm 早期应用时期 成熟应用时期 单位:百万美元 DPU市场处于发展早期,研发与设计 成本较高,初创企业通过订阅IP核授 权的方式降低研发成本,专注打造 自身核心竞争力,更好满足市场对 定制化功能的需求 制程:28nm IP核数:87个 制程:10nm IP核数:143个 制程演进 线宽缩小 晶体管 数量提升 单颗芯片 IP核增加 左图证实如下规律: VS. 制程演进推动单颗芯片IP核数增加 来源:头豹研究院13 2021 LeadLeo 400-072-5588 全球与中国DPU行业综述产业链上游(3/4) 中国封测行业率先实现国产替代,并逐步向技术壁垒更高,产品附加价值更大的先进封装发展,包括 WLCSP、3D封装等 1,564.3 1,889.7 2,193.9 2,349.7 2,509.5 2,685.2 2,873.1 3,045.5 3,246.3 3,441.1 0 500 1,000 1,500 2,000 2,500 3,000 3,500 中国封测市场规模,2016-2025预测 中国封测技术发展路径 单位:亿元 中国集成电路封装测试行业销售额从2016年的1,564.3亿元增长至2020年的 2,509.5亿元,年复合增长率为12.5%。封测行业为典型的劳动密集型行业,技术 壁垒相对较低,市场新入者增加,行业竞争加剧,导致中国集成电路封测行业的 增速放缓。2015年至2024年为中国5G基站建设的加速期,为集成电路产业新的 需求增长点。中国集成电路封测行业仍可享受5G时代的红利,预计集成电路封测 行业市场规模增速较2020年有所改善,维持在7%左右。 I/O数量和高性能需求 更 小 尺 寸 和 更 低 成 本 DiP SiP BGA WLP WLCSP PGA 2.5D/3D封装 LCC QFN SOP 为满足集成电路更小更轻及集成度更高的应用需求,封装技术由传统的封装技术 演变至先进封装技术。传统封装技术包括DiP、PLCC、QFP等。先进封装技术包 括BGA、QFN、2.5D/3D、WLCSP及Fan-out等。先进封装技术亦朝着I/O数量更 多,尺寸更小及成本更低的方向发展。 来源:头豹研究院14 2021 LeadLeo 400-072-5588 全球与中国DPU行业综述产业链上游(4/4) 中国大陆晶圆制程龙头企业中芯国际已成功突破14nm技术节点,与中国台湾台积电的技术差距进一步缩 小至1-2代 主流晶圆制造厂商逻辑制程节点 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 44/45nm 65nm 28nm 14nm 40nm 28nm 16nm 10nm 10nm 7nm 5nm 40nm 32nm 28nm 14nm 12nm 2018 年 , 退 出 10nm以下的研发 40nm 28nm 14nm 2018年,宣布退出10nm 及以下先进制程研发 55nm 25nm 微米制程 90nm 65nm 28nm 55nm 注:英特尔10nm芯片性能与台积电第一代7nm芯片性能相似 22nm 14nm 10nm 32/28nm 40nm 28nm 20nm 14nm 10nm 7nm Foundry IDM 分析 台积电制程节点在2016年反超IDM 随着芯片的制程工艺逼近物理极限,芯片制程升级的技术 难度和资金投入大幅上升。面向消费电子领域的处理器芯 片产品迭代速度快,IDM企业难以同时兼顾芯片设计与制 造先进技术的研发。在此背景下,芯片产业的分工逐渐明 显,以台积电和中芯国际为代表的晶圆代工厂在芯片制造 行业的价值凸显。 2016年,台积电成功研发10nm工艺,制程节点反超IDM 模式下的三星与英特尔。随后几年里,台积电遵从摩尔定 律,平均2年完成一次技术迭代,是业内第一家推出7nm 与5nm工艺的企业,稳居行业龙头。 中芯国际与台积电在制程上差距缩小至两代 中国以华为海思为首的芯片设计行业与以长电科技为首的 封测行业在近年均取得重大突破,而晶圆制造行业发展相 对缓慢。华为海思(Fabless)已成功推出7nm与5nm制程 的芯片,但中国大陆芯片制造环节薄弱,尚未出现成熟的 7nm与5nm制造工艺,导致华为长期寻求台积电代工。 中国大陆可量产28nm及以下芯片的企业仅有中芯国际与 华虹集团。2019年,中芯国际成功商用14nm工艺,在制 程上与台积电的差距缩小至2代。 来源:头豹研究院15 2021 LeadLeo 400-072-5588 中国DPU行业综述产业链下游 数通领域是DPU最大的应用市场,可为终端政企用户提供较为成熟的硬件加速解决方案; 随着NFV 技术的演进,电信市场对DPU的需求将逐步释放 DPU 4类核心功能对应各类应用场景+NFV技术演进激发电信市场对DPU潜在需求 功能实现 应用场景 数据面 控制面 数据 分组查表 虚拟路由 虚拟交换机 数据分组寻路 定义转发 规则 数据 分组检测 防火墙/ 安全组 数据分组解析 /帧头修改 规则下放 数据加密 数据解密 云安全 加/解密算法 实现 维护密匙 存储 云存储 NVMe实现 连接配置 RAID配置 NFV+边缘计算:网络虚拟化(Network Functiong Virtulizaiton)是5G关键技术之 一。NFV技术推动下,运营商对于边缘计算开放生态、降本增效、缩减部署周期的 诉求愈发明晰。边缘计算是赋能行业数字化转型的关键技术,对网络带宽、时延、 可靠性要求严苛,进而激发电信行业对DPU硬件加速技术的需求。 DPU可应用于数据传输、虚拟交换、数据安全、存储等场景 数通市场是DPU最大的应用市场 云计算厂商与大型互联网企业是DPU在数通市场最大客户,应 用场景集中于防火墙、云安全、云存储等方面 云计算厂商对DPU的诉求侧重点: 云计算 产业 通信 产业 A、计算速率: 25Gbps40Gbps之间 B、可靠性:99.99% C、灵活性:满足最低灵活性 数据中心带宽平均2-3年迭代一次, DPU企业需要具备为客户提供持续服务 的能力: 1、支持用户数据中心带宽的升级 2、支持在原有的硬件架构上灵活部署 新的功能 边缘计算建设痛点 DPU解决路径 边缘机房供电成本高,散热 能力、承重能力有限 DC化改造余地小、成本大, 无法提供足够的X86计算资源 DPU硬件加速技术提升边缘机房 单位面积算力 突破当前虚拟化转发性能瓶颈、 转发时延瓶颈(单服务器(双网卡) 吞吐量提升至3倍(180 Gps)、时延降 低90%(低于10 s)、功耗降低55%,) 来源:头豹研究院16 2021 LeadLeo 400-072-5588 商业模式 01 02 05 03 0417 2021 LeadLeo 400-072-5588 中国DPU行业商业模式梳理中国本土初创DPU供应商 模式一: 自研:中高级软件 外购:处理器、网络芯片 模式三: 自研:网络芯片+中高级软件 外购:处理器 模式二: 自研:处理器微架构+中高级软件 外购:网络芯片 回本周期最短:采用商业模式一的初创团队凸显轻资产运营优势,初步预判在5至8年收回前期成本 回本周期最长:模式二远期对上下游议价成本低,以高出货量回本,前期投入或超其他模式数十倍 总结:前期资本充足的情况下,初创DPU团队可自主研发处理器微架构,该类企业或将成为推动DPU国产替代的主力;以高级软件自研为核心 的初创企业通过定制化服务方案积累第一批熟客,以平均低于境外同类服务10%的价格,满足并理解中国云计算市场复杂应用场景的需求。 模式难度 门槛适中,依据软件设计、调 试、落地周期判断,DPU产线 核心研发团队需至少10人 代表企业 芯启源 回本方向 早期带领用户参与软件设计, 中期根据用户发展周期,层级 推进存储、安全、传输能力, 提高软件附加值,继而回本 获客方向 新赛道机房核心服务器 利润空间 定制化服务的高议价空间 盈利 持续性 服务形态持续:推动软件标 准化+保留软件定制服务 定价策略持续:歧视定价 模式难度 门槛较高,依据工艺流程拆解 环节判断,DPU产线核心研发 团队需具备至少40人 代表企业 中科驭数(自主KPU)、云豹 回本方向 将附加值较低的网络芯片外包, 聚焦资源自研高附加值的处理 器微架构,推动标准化产品的 规模化商用,实现回本 获客方向 大机房批量服务器 利润空间 对产业链上游的议价空间 盈利 持续性 产业链议价持续:远期配合 高级软件,提升对下游用户 的议价权 模式难度 门槛适中,从软件落地及网络芯 片自研流程拆解角度而言,DPU 产线核心研发团队需至少25人 代表企业 芯启源(战略转型方向) 回本方向 利用低成本的基础网络芯片产线, 配合软件服务实现营收,处理器 搭载方面,选择灵活度高,以灵 活适配的特点为卖点 获客方向 旧机房+中小型机房边缘服务器 利润空间 低成本采购方案,盘活既有渠道 盈利 持续性 客群定位持续:持续服务旧 机房客群,筛选未被其他竞 争者覆盖的边缘机房客户 来源:头豹研究院18 2021 LeadLeo 400-072-5588 中国DPU行业商业模式梳理全球DPU供应商 模式三: 自研:网络芯片+高级软件 外购:处理器 模式四: 自研:网络芯片+处理器 模式五: 自研:网络芯片+处理器+高级软件 市场份额蚕食:软硬件解耦推进业态变化,头部竞争者或成为新型商业模式的跟随者 竞争地位维护:复制新进入竞争者成功的商业策略,扩大免费服务覆盖的范围,持续收并购 总结:收并购扩充产线是DPU头部供应商巩固现有市场地位的惯用手段。初创企业通过相同技术与产品难以颠覆头部企业的市场地位,只有结 合商业模式以及逻辑上的创新才有机会突破头部企业的封锁 代表性 全球供应商 NVIDIA(Mellanox)、 Broadcom 盈利空间 固有产线出新+成本维稳:依靠 自身在传统产线的技术积累, 在网络芯片升级的同时保持或 压低成本 战略趋向 模式三对头部供应商而言属于 过渡阶段; 远期随SoC方案愈发成熟,头部 供应商采用FPGA方案占比降低, 其DPU产线将向模式四、模式 五转型,走向一站式服务 代表性 全球供应商 Intel、NVIDIA(Mellanox)、 Broadcom 盈利空间 市场话语权策略:定义市场基 调,在下游应用场景将DPU打 造成和CPU、GPU同等地位的三 大通用处理器,大规模铺开 战略趋向 (1)垄断DPU硬件:不断向先 进制程以及更高性能迈进; (2)持续集成:NVIDIA (Mellanox)未来或将GPU集成 至DPU,以提升DPU硬件性能, Intel秉持“FPGA与SOC”两条腿走 路的策略 代表性 全球供应商 Intel、NVIDIA(Mellanox)、 Broadcom 盈利空间 (1)绑定客户:为客户提供完 整的软、硬件解决方案; (2)持续服务:后期升级、维 护以及咨询服务扩大赢利空间 战略趋向 (1)开放生态:通过开放的软 件开发平台构建生态,软件社 区加速产品研发速度; (2)低成本吸引开发者:聚集 业界优秀开发者,丰富DPU功 能,采取差异化竞争路径 来源:头豹研究院19 2021 LeadLeo 400-072-5588 01 02 05 03 市场规模 0420 2021 LeadLeo 400-072-5588 DPU行业市场规模中国DPU市场规模 周期性:中国DPU市场规模增长周期与数据中心升级周期契合(3年左右),周期过程中,增长略平稳 市场规模:到2025年,中国DPU市场规模预计接近40亿美元 2020 年 ,中国D P U产品主要由N V I D I A (Mellanox)、Intel与Broadcom三家企业提 供,其中Mellanox凭借在网卡上积累的优势, 占据市场龙头位置。 中国DPU市场规模预计在2025年达到40亿美 元。通常数据中心带宽升级周期在3年左右。 中国将在2023-2025年进入下一轮服务器设备 以及DPU更换周期,DPU市场规模有明显的 增幅。 数通市场是DPU最大的应用市场,其中裸金 属服务器对DPU存在刚需。DPU在电信市场 的应用主要为边缘计算场景,渗透率不足5%。 针对智能驾驶领域的DPU仍在探索阶段,预 计在2023年DPU才有望布局在智能驾驶领域。 分析 中国DPU市场规模,2020-2025年预测 单位:万美元 8,814.75 52,051.30 110,554.84 326,855.10 307,299.18 374,092.92 50,000 100,000 150,000 200,000 250,000 300,000 350,000 400,000 2020年 2021年预测 2022年预测 2023年预测 2024年预测 2025年预测 来源:头豹研究院 21 2021 LeadLeo 400-072-5588 DPU行业市场规模全球DPU市场规模 全球DPU行业未来五年新增市场规模逐步攀升,主要得益于智能网卡方案的逐步成熟,叠加全球通用 服务器出货量的稳定增长以及L3级别智能驾驶汽车的技术落地 高网络密度及高算法密度催生DPU需求,叠加通用服务器出货量稳 定增长,全球DPU新增市场规模未来将达到135.7亿美元: 2020年全 球通用服务器新增出货量为1,210万台,同比增长3.1%,预计未来增 长率维持在3%左右。其中以互联网企业和云计算厂商为代表的数通 市场和电信市场服务器占比超过一半,其均有着较高的计算密度和 网络密度需求。在拥有大规模服务器的数通和电信厂商中,数据中 心带宽2-3年迭代一次,且服务器在网周期为5年,