欢迎来到报告吧! | 帮助中心 分享价值,成长自我!

报告吧

换一换
首页 报告吧 > 资源分类 > PDF文档下载
 

20230417_东兴证券_电子行业证券研究报告:“FPGA五问五答”系列报告二_17页.pdf

  • 资源ID:172304       资源大小:3.36MB        全文页数:17页
  • 资源格式: PDF        下载积分:9.9金币 【人民币9.9元】
快捷下载 游客一键下载
会员登录下载
三方登录下载: 微信开放平台登录 QQ登录  
下载资源需要9.9金币 【人民币9.9元】
邮箱/手机:
温馨提示:
用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
支付说明:
本站最低充值10金币,下载本资源后余额将会存入您的账户,您可在我的个人中心查看。
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,下载共享资源
 
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,既可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

20230417_东兴证券_电子行业证券研究报告:“FPGA五问五答”系列报告二_17页.pdf

敬 请参阅 报告结 尾处的 免责声 明 东方财智 兴盛之源 行业研究 东兴证券股份有限公司证券研究报告 FPGA 和CPU、GPU 有什么区别?为 什么越来越 重要?“FPGA 五问五 答”系 列报告 二 2023 年 4 月 17 日 看好/维持 电子 行业报告 分析师 李美贤 电话:13718969817 邮箱 limx_ 执业证书编号:S1480521080004 投 资 摘要:近年来,诸如 TPU、MPU、DPU 等的“X”PU 们似乎层出不穷,市场经常会对这些新创造出的名词感到困惑:为什么会出现这么多的单元?作为我们 FPGA 五问五答 系列报告 二,在 这篇报告中,我们 进一步回答 投资 人最 常 问的问 题之一:FPGA 和CPU、GPU有 什 么 区别?为什么越 来越重要?我们认为,这个问题不是简单回答他们的区别就可以解决的,因此我们单拎出来解答。我们认为,众多“X”PU 出现的原因,本 质上是由于 CPU 的算力到达瓶颈了,背后是通用计算时代的终结。从发明以来,CPU 算力的提升主要依靠两大法宝:一是提高时钟频率,二是增加处理器内核数,但这些方法到现在也遇到瓶颈了,人们开始放弃使用一个超强的 CPU 完成所有事情,而是对某些重复的场景,卸载到专用的加速器,以达到新一阶段的降低功耗,提升性能的目的,这就是“X PU”等加速器兴起的原因。同时,自 2010 年 AI 兴起,AI 模型的训练所需的算力是爆发式的增长,且“加&乘”的本质使得算力要求愈发偏向高并行而不是高串行,因此 CPU 越来越难以胜任高 算力的场景,通用计算时代终结,数据中心走向加速器时代。未来 10 年,在数据中心高性能计算及 AI 训练中,CPU 这一 主角 的重要性下降,而以往的 配角们,即 GPU、FPGA、TPU、DPU 等 的 加 速 器 的重要 性在上升。FPGA 相比 CPU 的 巨大优势在于确定性的低 时延,这是架构差异造成的。CPU 的利用率越高,处理时延便越大,而 FPGA无论利用率大小,其处理时延是稳定的。在汽车和工业这些需要确定低时延的场景,FPGA 具有非常大的优势。此外,FPGA相比 CPU,具有更高的灵活性。FPGA 相比 GPU 的 优 势在于更低的功耗和时延。GPU 无法很好地利用片上内存,需要频繁读取片外的 DRAM,因此 功耗非常高。FPGA 可以灵活运用片上存储,因此功耗远低于 GPU。F PG A“无批次(Batch-less)“的架构,使其在 AI 推理中相比GPU 具有非常强的时延优势。此外,GPU 的接口单一,而 FPGA 在接口灵活性上具有无可比拟的优势,特别适合工业场景。为什么 FPGA 是 战略芯片?我们认为,未来科技发展有两个领域处于战略地位:一是 AI,二是太空。AI 代表人类更高级别的生产力工具,而太空是 可供 人类开发 探索 的 广阔而 未知领域。FPGA 凭借其架构带来的时延和功耗优势,在 AI 推理中具有非常大的优势。同样,FPGA 独特的优势使其在 航空航天领域 有非常广泛的应用。目前,我们看到太空活动发生新变化,背后是太空不断增 长的算力需求。变化 1:地球观测、探火活动在增加;变化 2:寻求扩大 AI 在太空的应用,以及宽带卫星通信的快速增长,提高了算力要求;变化 3:航天级器件的代际差在缩小,处理能力越来越接近目前最高水平。当今 全球地缘政治紧张 的背景下,各国自有卫星星座需求激增,太空活动进入新活跃期。FPGA 在 航 天领域为什么更具有优势?主要有两点原因:1)FPGA 可以降低项目的时间和金钱成本。航空航天存在着小批量多品种的应用,本质是一个长尾的市场,能够适配的 ASSP 较少,而如果专门设计一 颗 ASIC 成本则会非常高,时间也会变得非常长,由此造成的时间成本不是线性的。F PG A“万能”的特点,可以节省 ASIC 的 NRE 成本,设计周期也大幅缩短,避免重复的可靠性认证,加快项目进展;2)FPGA 动态可重构的特点可以降低在轨错误。太 空项目本质是风险厌恶的,一旦发生错误,可能导致数亿美元甚至生命 的 损失。航天级的 FPGA 可以 通过定期刷新回读、动态重构的方式,避免 或者减轻 宇宙射 线对 自身 造成的 破坏,是其它器件所无法做到的。风 险 提 示:下游需求不及预期,中美贸易战超预期。P2 东 兴 证 券深 度报 告 FPGA 和 CPU、GPU 有 什么区 别?为 什么越 来越重 要?“FPGA 五 问五答”系列 报告 二 敬 请参阅 报告结 尾处的 免责声 明 东方财智 兴盛之源 目 录 1.为什么会有这么多 的 PU?配角们 的 时代.3 2.相比 CPU,FPGA 的 并行性和灵活性更高,能提供确定性的时延.5 3.相比 GPU,FPGA 的 时延和功耗更有优势.8 4.FPGA 的 战略意义:AI&Space.11 风险提示.14 插图目录 图 1:CPU 面临算力瓶 颈的原因.3 图 2:2010 年兴起以来,AI 模型对算力的要求呈现爆 发式增长,速度远超摩尔定律.4 图 3:MLP 网络本质是并 行的乘法和累加,非常适合在 FPGA 中 实现.4 图 4:微软的 Azure 使用 FPGA 加速 Bing 搜 索,网络吞吐量大幅上升,时延下 降了 80%.5 图 5:FPGA 能 完成 SIMD、MISD 和 MIMD 的 处理,特别适合并行计算.6 图 6:将 CPU 的核心简 化以加快执行速度,是 GPU 设 计的思想.6 图 7:FPGA 的 时延远低 于 CPU,是因为其架构不需要在获 取指令、编译指令、分支预测等方面花费时 间.7 图 8:FPGA 确 定性的低 时延,使其在工业和汽车上具有非常大的优 势.7 图 9:FPGA 可 以灵活利 用片上内存,不需要像 CUDA 一 样从 DRAM 来 回读写数据.8 图 10:FPGA 仅用 200MHz,就可以实现比 CPU 快 43 倍、比 GPU 快 3 倍的效果,而且功耗仅为 GPU 的 20%.9 图 11:FPGA 的 时延低于 GPU,无 批次的结构,使其在 AI 推理特别有优势.10 图 12:FPGA 更 适合 AI 推理,在低时延、非标准化的场景非常有优势.10 图 13:近 5 年来,在 地缘政治紧张的态势下,中美两国太空发射 次数迅速增长.11 图 14:美国太空活动的新变化,反映出航空航天 领域不断增长的算力需求.12 图 15:FPGA 在 航天项目的参与度非常高.12 XVDWyRnQsRqRqOsRrMpQpObRaO8OoMqQmOoNjMoOrNeRnMsN6MnMsNNZmMsPwMtQyR 东 兴 证 券深 度报 告 FPGA 和 CPU、GPU 有 什么区 别?为 什么越 来越重 要?“FPGA 五 问五答”系列 报告 二 P3 敬 请参阅 报告结 尾处的 免责声 明 东方财智 兴盛之源 1.为 什 么会有这 么多的 PU?“配角 们”的时 代 近年来,诸如 TPU、MPU、DPU 等的”X”PU 们似乎层出不穷,市场 经常会对 这些 新创造出的名词感到困惑:为什么会出现这么 多的单元?本质上是 由于 CPU 的算力 到达瓶颈了,背后是 通用 计算 时代 的终结。从发明以来,CPU 算力的提升主要依靠两大 法宝:一是 提 高时 钟频 率,但时钟频率提升面临瓶颈 了。因为越高的时钟频率,意味着 每秒可执行的运算次数越高,但随 着 电压下降到 0.6v 的“底限”,Dennard 缩放 定律(Dennard Scaling)在 05 年开始 崩溃,再提高时钟频率 就 会使得功耗 以 指数级别增长,因此我们在 05 年后遇到了频率墙;二 是 增 加处 理 器内 核数,换取频率降低带来的功耗 预算,但由于 核间 调度 同样 需要 时延 和 功耗 花销,很快,核数的增长又遇到了瓶颈,由于 数据中心的 散热 技术 约束了功率 增长,导致处理器上许多核无法 同时工作,这就是 暗硅效应。因此,人们 开始 放 弃使 用一 个超 强的 CPU 完成 所有 事情,而是 对 某些 重复 的场 景,卸载到专用的加速 器,以达到 新一 阶段 的 降低 功耗,提升 性能 的目 的,这就 是“XPU 等加 速器 兴起 的原 因。图1:CPU 面临 算 力 瓶 颈的原因 资料来源:Intel,Princeton University,东兴 证券研 究所绘制 同时,自 2010 年 AI 兴起,AI 模型 的训 练所 需 的算 力 是 爆发式 的 增长,且“加&乘”的本 质 使得 算力要求 愈发偏向 高并行 而不 是高串行。CPU 越来越难以胜任高算力的场景,将需要大规模、高密度的计算任务 卸载到在某一方向做了优化的专用处理器,就 产生 了这些不同的“X”P U,他们 之间 区别 在于 在某 些场 景的 专用 性。P4 东 兴 证 券深 度报 告 FPGA 和 CPU、GPU 有 什么区 别?为 什么越 来越重 要?“FPGA 五 问五答”系列 报告 二 敬 请参阅 报告结 尾处的 免责声 明 东方财智 兴盛之源 图2:2010 年 兴起 以来,AI 模型 对算力的要求呈现 爆发式增长,速度远超摩尔定律 资料来源:OpenAI,东兴证 券研究 所 绘制 通用计算时代终结,数据 中心 走向 加速 器时 代。未来 10 年,FPGA 的重 要 性不断上升。随着 CPU 算力逐渐达到瓶颈,越来越无 法满足神经网络 指数级增长的算 力需求。在数 据中心这一人类 算力需求最高 的设施中,算力发展的方向愈发转向专用性,以寻求更高的性能、更低的能耗和成本。我们看到,未来 10 年,在数据中心高性能计算及 AI 训练中,CPU 这一“主角”的重要性下降,而以往的“配角们”,即 GPU、FPGA、TPU、DPU 等的加速器的重要性在上升。图3:MLP 网 络 本 质 是并行的乘法和累加,非常适合在 FPGA 中实现 资料来源:FPGA Neurocom puters,东兴证券研究所 东 兴 证 券深 度报 告 FPGA 和 CPU、GPU 有 什么区 别?为 什么越 来越重 要?“FPGA 五 问五答”系列 报告 二 P5 敬 请参阅 报告结 尾处的 免责声 明 东方财智 兴盛之源 因此,从 2017 年开始,越来 越多 的 大型 公有 云 开始正式 使用 FPGA、GPU 作为加速器,以获得数百倍于CPU 的 性能 提升。例如,微软的 Catapult 项目 就 使用了 FPGA 以加速 Bing 的搜索速度,AWS 的 F1 Instances将 FPGA 的算力作为 服务提供给客户,阿里云 使用了 FPGA 为其“双十一”进行了零售 交易系统的 加速。图4:微软的 Azure 使用 FPGA 加速 Bing 搜索,网络吞吐量大幅上升,时延下降了 80%资料来源:微软,东兴证 券研究 所 2.相比 CPU,FPGA 的 并行性 和灵 活性 更高,能提供 确定性的 时延 处理器负责对外界 输入的数据进行处理,CPU、GPU、FPGA 等处理器的区别在于处理 流程,CPU 的处理流程使其 擅长 串行计算,以复杂的控制为特征,GPU 和 FPGA 的则 更 擅长 大规模的 并行计算:CPU 是冯诺依曼架构下的处理器,遵循“Fetch(取指)-Decode(译码)-Execute(执行)-Memory Access(访存)-Write Back(写回)”的处理流程,数据要先通过控制单元获取存在 RAM 中的指令,再解码得知用户需要对数据做何种运算,然后再将数据送到 ALU 进行对应的处理,结束运算后存回 RAM,再获取下一个指令。这一处理流程,即 SISD(Single Instruction Single Data),决 定了 CPU 擅长决策和控制,但在 多数 据处 理任 务中 效率 较低。现代的 CPU 可以同时做到 SISD 和 SIMD 的处理,但在并行规模上 依然 不如 GPU 和 FPGA。GPU 遵循的是 SIMD(Single Instruction Multiple Data)的处理方式,通过 在多个线程上运行统一的处理方 式,即 Kernel,来达 到将 CPU 发送过来的数据做高并行处理的目的。由于去除了现代 CPU 中分支预测、乱序执行、存储预取等模块,也减少了许多 cache 的空间,GPU 中经过简化后的“核”能实现非常大规模的并行运算,并且节省了大部分 CPU 需要花费在分支预测、重排的时间,但缺点是需要数据适应 GPU 的处理框架,例如需要数据做批次对准,因此依然无法达到最大的实时性。FPGA 则是由用户自 定义处理流程,可以直接决定片上的 CLB 是如何相连的,数十万个 CLB 可以独立运算,即 SIMD、MISD(Multiple Instruction Single Data)和 MIMD(Multiple Instruction Multiple Data)的处理都可以在FPGA 实现,由于 处理 流程 已经 映射 到硬 件上,不需 要再 额外 花费 时间 获取 和编 译指 令,同样不需要像CPU 一样花费 时间 在乱序执行等步骤,这使得FPGA 在数据处理中具有非常高的实时性。P6 东 兴 证 券深 度报 告 FPGA 和 CPU、GPU 有 什么区 别?为 什么越 来越重 要?“FPGA 五 问五答”系列 报告 二 敬 请参阅 报告结 尾处的 免责声 明 东方财智 兴盛之源 图5:FPGA 能完成 SIMD、MISD 和 MIMD 的 处 理,特 别适合并行计算 资料来源:Flynn,东兴 证券研 究所绘制 因此,GPU 和 FPGA 都是 作为 CPU 的任 务卸 载 单元,在 并行 计算 的效 率都 高 于 CPU。在数据中心高性能计算的场景中,GPU 和 FPGA 往往以分立的加速卡形式存在,即 CPU 将部分密集计算的任务“卸载”到GPU 或者 FPGA,这些“器件”通过 PCIe 和 CPU 互联,以完成高并行的计算加速。图6:将 CPU 的 核 心 简 化以加快执行速度,是 GPU 设 计 的思想 资料来源:Virginia Tech,东 兴 证 券研究 所 绘制 东 兴 证 券深 度报 告 FPGA 和 CPU、GPU 有 什么区 别?为 什么越 来越重 要?“FPGA 五 问五答”系列 报告 二 P7 敬 请参阅 报告结 尾处的 免责声 明 东方财智 兴盛之源 FPGA 相比 CPU 的巨 大优 势 在于 确定 性的 低时延,这是架构 差异 造成的。CPU 的 时延 是不确定的,当利用率升高时,CPU 需要处理更多的 任务,这就需要 CPU 进行任务调度重排,因此 造成处理 时延 往往是不可控制地 变大,即 任务越多算得越慢。而 FPGA 的时延 之所以是确定的,是因为 在 布局 布线阶段,设计工具 就已经确保 能 够让 最差路径 满足 时序 要求,不需 要再 花费 时间 在获 取指 令、解码 指令 等 通用 处理 器需 要的 步骤,也避免了随之而来的重排执行顺序、指令调度等待的问题。图7:FPGA 的时延远低于 CPU,是 因为 其架构不需 要在获取指令、编译指令、分支预测等 方面 花费时间 资料来源:Parker,东兴证 券研究 所 绘制 CPU 的 利用 率越 高,处理 时延 便越 大,而 FPGA 无 论利 用率 大小,其 处理 时延 是 稳定 的。FPGA 可以提供纳秒级的处理 时延,而 CPU 通常在毫秒级。例如,在 自动驾驶 系统 中,将摄像 头的 数据 直接 传输 到 FPGA的 MIPI 接口中,其最好和最差情况 下的处理时延 差距 仅为 22ns,而 在有 CPU 参与数据传输的情况下,这一差距 在 23ms 以上,相当 于 CPU 在繁忙情况下时延翻倍。此外,当利用率 上升到 90%时,CPU 的处理时 图8:FPGA 确定性的低时延,使 其 在 工 业 和 汽 车 上 具 有 非 常 大的 优 势 资料来源:Intel,东兴证 券研究 所 绘制 P8 东 兴 证 券深 度报 告 FPGA 和 CPU、GPU 有 什么区 别?为 什么越 来越重 要?“FPGA 五 问五答”系列 报告 二 敬 请参阅 报告结 尾处的 免责声 明 东方财智 兴盛之源 间长 达 46ms,对于以 100km/h 的速度行驶的汽车,46ms 意味着 摄像头从看到障碍物,到汽车 系统 采取制动措施 时,车子 已经开出 了 至少 1.28 米的距离,而 FPGA 仅有 3-6米,即可 以等同 为瞬间就能反 应,省去 的这 1.28m 的距离,就 可能减少许多碰撞事故的发生 概率。因此,在 汽车 和工 业这 些需 要 确定低时延的场景,FPGA 具 有 非 常 大的 优势。FPGA 相比 CPU,具有 更高 的灵 活 性。在工业 现场往往有许多 需要细微调整,例如,根据 传送带 磨损情况 对马达进行细微的控制 调整,为设备更新新的协议等等,CPU 往往难以 做到,由于 FPGA 是动态可重构的,可以 在使用 现场调整,随时适应 新的 变化。此外,FPGA 还可以同时 融合 工业现场的 PLC、网关、传感器、马达、HMI 等设备,实现不同设备的实时控制和通信。3.相比 GPU,FPGA 的 时延和 功耗 更有优势 GPU 的功 耗非 常 高,因为其无法 很好地 利用 片上 内存,需 要频 繁读 取片 外的 DRAM。尽管在吞吐量上的优势使得 GPU 几乎垄断了深度学习领域,但 GPU 依赖片外存储的 处理流程,使 其在功耗和时延上对比 FPGA有非常大 的弱势。以英伟达的 GPU 为例,使用 CUDA 进行 训练,主要 有四 个步 骤:1)将数 据从 CPU 的 外部存储(DRAM)复制到 GPU 的存储中;2)CPU 加载(Lauch)需要 进行 的计 算,即 Kernel 到 GPU 中;3)GPU 执行 CPU 发送过来的指令;4)GPU 将结果最终存回 CPU 的 DRAM 中,再进行下一个 Kernel 的计算。因此,CUDA 涉及了两次存储读写。而 FPGA 可以将第一个 Kernel 的结果缓存到 片上 星罗棋布的 BRAM中,完全可以不需要读写外部 存储 就能完成整个算法。由于 读取 DRAM 所消耗的能量是 SRAM 的 100 倍以上,是加法的 6400 倍,GPU 这一 需要 频繁读取 DRAM 的处理,使其 功耗 远高于 FPGA,而且 DRAM 的带宽往往成为了性能的瓶颈。一片 FPGA 的典型 功耗通常是 30W 50W,而 单片 GPU 功耗 就可以高达 图9:FPGA 可以灵活利用片上 内 存,不 需 要 像 CUDA 一样 从 DRAM 来 回 读写数据 资料来源:NVIDA,东 兴证 券研究 所 绘制 东 兴 证 券深 度报 告 FPGA 和 CPU、GPU 有 什么区 别?为 什么越 来越重 要?“FPGA 五 问五答”系列 报告 二 P9 敬 请参阅 报告结 尾处的 免责声 明 东方财智 兴盛之源 250W 400W,使得 单机柜的功率密度可能高达 28kw,这对数据中心的现有的散热造成了巨大压力,往往需要专门更改制冷和供电系统,以适应单柜 15kw 以上的功率密度,而 FPGA 数十瓦的功耗可以和现有数据中心散热兼容,不需要额外改造。FPGA 可 以灵 活运 用片 上存 储,因此 功耗 远低 于 GPU。FPGA 完全可以不需要读 DRAM,整个算法在片上完成。例如,深鉴科技利用 FPGA 做出了 ESE 的模型并在不同的处理器(CPU/GPU/FPGA)上运 行,发现FPGA 上训练时长最短,能耗最小。在能耗上,CPU Dense 耗能 11W、CPU Sparse 耗能 38W、GPU Dense耗能 202W,这是耗能最大的一种情况、GPU Spare 耗能 136W,相比之下 FPGA 仅需 41W;在训练时延上,FPGA 用时 8 2.7 s,远小于 CPU 的 6 0 1 7.3 s,也仅为 GPU 训练时长的三分之一。图10:FPGA 仅用 200MHz,就 可 以 实现 比 CPU 快 43 倍、比 GPU 快 3 倍 的效果,而且功耗仅为 GPU 的 20%资料来源:ESE:Efficient Speech Recognition Engine with Sparse LSTM on FPGA,Energy table for 45nm process,东 兴 证 券 研究所 绘制 FPGA 无 批次(Batch-less)“的架构,使 其在 AI 推理中 具有 非常 强的 时延优势。受限于网络条件和时延,许多决策 来不及 上传云端,只能 本地执行,这就是 边缘 计算。边缘计算 通常 面临时延和功耗 两大 约束。GPU需要等待批次的特点,使其时延要高于 FPGA。GPU 通常需要将不同的训练样本划分成固定大小的“Batch(批 次)”,为 了最 大化 达到 并行 性,需要将数个 Batch 都集齐,再 统一 进行处理,每个 Batch 的数据一般有近百个。这使得 GPU 在训练大型样本时非常有优势,但在 做 涉及小样本的 推理时,这一 优 点成为了劣势,因为 推理通常只需要很小的输入 数据,而 GPU 的架构 额外引入了时延。FPGA 的架 构是 无批 次(Batch-less)的,可以 根据 数据 特点 确定 处理 方式,不需要 像 GPU 一样将输入的数据划分成 Batch,因此 可以做到最低的时延,使得 FPGA 在 进行 AI 推理时具有非常大的优势。FPGA 在 接口 灵活 性上 具有 无可 比拟 的优 势,特别 适合 工业 场景。工业实质是高度分散的小批量场景,存在大量的非标准的接口,例如,工业的图像传感器的 LVDS 编码格式往往没有统一的标准,工程师很难找到对应的专用芯片去对接。GPU 的接 口单 一,只有 PCIe 一种,而 FPGA 的可编程性使其能与任何的器件进行通信,能够适应任何的标准和非标准的接口,这种硬件可编程带来的高度灵活性是 FPGA 在工 业场 景的 优 势。目前,阻碍 FPGA 市场进一步扩大的原因 是其较高的使用门槛,正通 过 HLS 等工具解决。CPU 使用人员更多是软件工程 师,语言基本为 C/C+等编程语言,GPU 亦有 CUDA 等非常完善的开发框架,而 FPGA 的使用者 更多像是硬件工程师,需要自行定义电路功能、进行时序优化等步骤,语言基本为 Verilog/VHDL 这两种 P10 东 兴 证 券深 度报 告 FPGA 和 CPU、GPU 有 什么区 别?为 什么越 来越重 要?“FPGA 五 问五答”系列 报告 二 敬 请参阅 报告结 尾处的 免责声 明 东方财智 兴盛之源 图11:FPGA 的时延低于 GPU,无 批 次 的结构,使其在 AI 推 理特别 有优势 资料来源:Xilinx,东 兴证券 研究所 绘制 硬件描述语言,需要 使用者 精通软件和硬件,难度 因此 更大。因此,为了降低 使用门槛,FPGA 学界和 业内合作 推出了 HLS(High-level Synthesis,高层次 综合)的工具,可以 通过 C/C+语言 直接生成 能供 FPGA使用的 RTL 网表,跳过中间的硬件描述 环节,让工程师 更加专注 AI 算法的开发和迭代。图12:FPGA 更适合 AI 推 理,在 低 时延、非标准化的场景非常有 优势 资料来源:BERTEN,东 兴 证 券研 究所绘制 东 兴 证 券深 度报 告 FPGA 和 CPU、GPU 有 什么区 别?为 什么越 来越重 要?“FPGA 五 问五答”系列 报告 二 P11 敬 请参阅 报告结 尾处的 免责声 明 东方财智 兴盛之源 4.FPGA 的 战略意义:AI&Space 为什 么 FPGA 是 战略 芯片?我们认为,未来 科技 发展 有两个领域处于战略地位:一是 AI,二是 太空。AI 代表人类更高级别的生产力工具,而太空是可供人类开发探索的广阔而未知领域。FPGA 凭借其架构带来的时延和 功耗 优势,在 AI 推理中具有非常大的优势。同样,FPGA 独特的优势使其在航空航天领域有非常广泛的应用。全 球 地 缘政 治 紧张 下,各 国自 有 卫星 星 座需 求 激增,太空 活 动进 入新 活 跃期。上一 个太 空 发射 活跃 期 在1957-1977 年,美苏在太空领域展开激烈竞争,两国年平均发射活动均超 40 次。随着美苏太空竞赛结束,20 年间太空发射数大幅回落。而在近年地缘政治紧张态势下,各国部署自有通信卫星星座需求激增。中美两国在近 3 年的太空发射 活动 剧升,仅去 年全 年,中美 发射 次数 合计 占全 球 76%。由于 频段 和低 轨空 间是 不可再生资源,各国的低轨卫星计划实际承担“占频保轨”的任务。随着大批的低轨卫星计划在未来 4-5 年内完成发射组网,太空活动实际已进入新的活跃期。图13:近 5 年来,在地缘政治紧张的态势下,中美两国太空发射次数 迅速 增长 资料来源:Launch Logs,东 兴证 券研究 所 绘制 目前,我们看到 太空 活 动 发 生 了 三大新 变 化,背后 反 映的 是 太空 不 断增 长 的 算力 需求。美国 JPL(Jet Propulsion Laboratory,喷气推进实验室)是美国国家航空航天局(NASA)负责 无人 太空 探 测的 机构,我们统计了 JPL 目前的所有任务目标,发现了 以下 三大变化:1)地球观测、探火 活动 在 增加。以地球为目标的太空活动 占比 35%,目的 主要有气象和环境观测,构建与外太空交流的 深太空网络(DSN),利用合成孔径雷达对地面进行高精度观测等,主要 是出 于军 事及 科研 目的;而火星相关的活动占比高达 15%,是因为 火星是与地球最 相似 的行星,了解火星 表面的岩石、气候,目的是 了解火星 在过去 是否有生命存在,可以为人类探索 和开发 火星做准备。P12 东 兴 证 券深 度报 告 FPGA 和 CPU、GPU 有 什么区 别?为 什么越 来越重 要?“FPGA 五 问五答”系列 报告 二 敬 请参阅 报告结 尾处的 免责声 明 东方财智 兴盛之源 2)寻 求扩 大 AI 在太 空的 应用,以 及宽 带 卫星 通信 的快 速 增长,提 高了 算力 要求。以 观测卫星为例,地球60%图14:美国 太 空活动的新变化,反映出 航空航天领域不断增长的算力需求 资料来源:JPL,Xilinx,东兴证 券研究 所 绘制 以上的面积常年被云层覆盖,只有 10%的区域是晴空无云的状态,以往观察卫星都是不加甄别,将拍摄的照片全部回传地面处理。如今,在观察卫星上使用 AI 识别出含有云层的照片并丢弃,只回传清晰的照片,可以节省本就有限的星地通信的带宽。除此之外,宽带卫星通信要求卫星具备星上处理和转发数据的能力,以降低时延,减少对地面站的依赖;3)航天级器件的代际差在缩小,处理 能力 越来 越接 近目 前最 高水 平。过去,航天级 FPGA 的推出时间一般晚于对应商业级器件 3-5 年,长期落后于当时最领先的器件 1-2 个代际,10-15 年前的 FPGA 依然在航天器上广泛使用。然而,近两年来,我们看到 FPGA 龙头赛灵思加快了宇航级 FPGA 的推出。目前,赛灵思最先进的FPGA 产品是 19 年推出的 Versal(7nm),而 赛灵思 在 21 年初 就推出了宇航级的 Versal XQR,做到 了和 商业 级同代际。Versal XQR 不仅逻辑单元数相比往代大幅增加,还嵌入了 AI 处理单元、高速的收发器等,大幅提高了低轨卫星的处理能力和反应时间。图15:FPGA 在航天项目的参与 度 非 常 高 东 兴 证 券深 度报 告 FPGA 和 CPU、GPU 有 什么区 别?为 什么越 来越重 要?“FPGA 五 问五答”系列 报告 二 P13 敬 请参阅 报告结 尾处的 免责声 明 东方财智 兴盛之源 资料来源:Xilinx,NASA,东 兴 证券研 究所绘制 FPGA 在 航天 领域 为什 么更 具有 优势?主要有两点原因:1)FPGA 可 以降 低项目的 时间和金钱成本。航空航天存在着小批量多品种的应用,本质是一个长尾的市场,因此能够适配的 ASSP 较少,而如 果专 门设 计一颗 ASIC 成本 则会 非常 高,时间也会变得非常长,由 此造 成的 时间 成本 不是 线性 的。例如,地球和火星大约每两年(780 天)距离最短,此时发射所需能量最小,窗口期大 多只有 2 个月,如果没有来得及在窗口期完成发射,即使只差一个月,下一次发射就要再等两年,而 F P G A“万能”的特点,可以节省 ASIC 的 NRE 成本,设计周期也大幅缩短,避免重复的可靠性认证,加快项目进展;2)FPGA 动态可重构的特点可以 降低 在 轨错 误。太空项目本质是风险厌恶的,因为一旦发生错误,可能导致数亿美元甚至生命损失。航天器运行在充 满高能粒子的太空环境中,宇宙射线随时可能对电子器件造成损坏,而航天级的 FPGA 可以定期刷新回读,避免 SEU 等事件造成的故障。当在轨航天器发生错误时,地面可以直接发送指令让 FPGA 进行重构,即在轨动态重构;如果部分 LUT 被宇宙射线造成 物理损坏,完全可以绕开损坏部分进行重构;对于 已经 运行 了多 年的 卫星,可以 重构 更新 其功 能,不需 要发 射新 的卫 星。FPGA这一在轨可重构是其它器件所无法做到的。P14 东 兴 证 券深 度报 告 FPGA 和 CPU、GPU 有 什么区 别?为 什么越 来越重 要?“FPGA 五 问五答”系列 报告 二 敬 请参阅 报告结 尾处的 免责声 明 东方财智 兴盛之源 风 险 提示 下游需求不及预期,中美贸易战超预期。东 兴 证 券深 度报 告 FPGA 和 CPU、GPU 有 什么区 别?为 什么越 来越重 要?“FPGA 五 问五答”系列 报告 二 P15 敬 请参阅 报告结 尾处的 免责声 明 东方财智 兴盛之源 分 析 师 简介 分 析 师:李 美贤 中国人民大学 硕士,2019 年 7 月加入东兴证券研究所,从事通信及电子研究,关注新兴科技领域,重点覆盖 AI、云计算、工业互联网等产业链。分 析 师 承诺 负责本研究报告全部或部分内容的每一位证券分析师,在此申明,本报告的观点、逻辑和论据均为分析师本人研究成果,引用的相关信息和文字均已注明出处。本报告依据公开的信息来源,力求清晰、准确地反映分析师本人的研究观点。本人薪酬的任何部分过去不曾与、现在不与,未来也将不会与本报告中的具体推荐或观点直接或间接相关。风险提示 本证券研究报告所载的信息、观点、结论等内容仅供投资者决策参考。在任何情况下,本公司证券研究报告均不构成对任何机构和个人的投资建议,市场有风险,投资者在决定投资前,务必要审慎。投资者应自主作出投资决策,自行承担投资风险。P16 东 兴 证 券深 度报 告 FPGA 和 CPU、GPU 有 什么区 别?为 什么越 来越重 要?“FPGA 五 问五答”系列 报告 二 敬 请参阅 报告结 尾处的 免责声 明 东方财智 兴盛之源 免责声明 本研究报告由东兴证券股份有限公司研究所撰写,东兴证券股份有限公司是具有合法证券投资咨询业务资格的机构。本研究报告中所引用信息均来源于公开资料,我公司对这些信息的准确性和完整性不作任何保证,也不保证所包含的信息和建议不会发生任何变更。我们已力求报告内容的客观、公正,但文 中的观点、结论和建议仅供参考,报告中的信息或意见并不构成所述证券的买卖出价或征价,投资者据此做出的任何投资决策与本公司和作者无关。我公司及报告作者在自身所知情的范围内,与本报告所评价或推荐的证券或投资标的不存在法律禁止的利害关系。在法律许可的情况下,我公司及其所属关联机构可能会持有报告中提到的公司所发行的证券头寸并进行交易,也可能为这些公司提供或者争取提供投资银行、财务顾问或者金融产品等相关服务。本报告版权仅为我公司所有,未经书面许可,任何机构和个人不得以任何形式翻版、复制和发布。如引用、刊发,需注明出处 为东兴证券研究所,且不得对本报告进行有悖原意的引用、删节和修改。本研究报告仅供东兴证券股份有限公司客户和经本公司授权刊载机构的客户使用,未经授权私自刊载研究报告的机构以及其阅读和使用者应慎重使用报告、防止被误导,本公司不承担由于非授权机构私自刊发和非授权客户使用该报告所产生的相关风险和责任。行 业 评 级体 系 公 司投 资评 级(A 股 市场 基 准为 沪 深 300 指数,香港 市场 基准 为 恒生 指 数,美 国市 场 基准 为 标普500 指数):以 报 告日 后 的 6 个 月内,公司 股 价相 对 于同 期 市场 基 准指 数的 表现 为 标准 定 义:强 烈 推荐:相对 强 于市 场 基准 指 数收 益 率 15 以 上;推 荐:相 对 强于 市 场基 准 指数 收 益率5 15 之间;中 性:相 对 于市 场 基准 指 数收 益 率介 于-5+5 之 间;回 避:相 对 弱于 市 场基 准 指数 收 益率5 以上。行 业投 资评 级(A 股 市场 基 准为 沪 深 300 指数,香港 市场 基准 为 恒生 指 数,美 国市 场 基准 为 标普500 指数):以 报 告日 后 的 6 个 月内,行业 指 数相 对 于同 期 市场 基 准指 数的 表现 为 标准 定 义:看 好:相 对 强于 市 场基 准 指数 收 益率5 以上;中 性:相 对 于市 场 基准 指 数收 益 率介 于-5+5 之 间;看 淡:相 对 弱于 市 场基 准 指数 收 益率5 以上。东兴 证 券研 究所 北京 上海 深圳 西城 区金 融大 街 5 号新 盛 大厦 B座 16 层 虹口 区杨 树浦 路 248 号瑞 丰国 际大厦 5 层 福田 区益 田路6009 号新 世 界中 心46F 邮编:100033 电话:010-66554070 传真:010-66554008 邮编:200082 电话:021-25102800 传真:021-25102881 邮编:518038 电话:0755-83239601 传真:0755-23824526 前沿报告库是中国新经济产业咨询报告共享平台。行业范围涵盖新一代信息技术、5G、物联网、新能源、新材料、新消费、大健康、大数据、智能制造等新兴领域。为企事业单位、科研院所、投融资机构等提供研究和决策参考。扫一扫免费获取海量报告

注意事项

本文(20230417_东兴证券_电子行业证券研究报告:“FPGA五问五答”系列报告二_17页.pdf)为本站会员(18709673099)主动上传,报告吧仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知报告吧(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2022 报告吧 版权所有
经营许可证编号:宁ICP备17002310号 | 增值电信业务经营许可证编号:宁B2-20200018  | 宁公网安备64010602000642号


收起
展开