深度学习框架到底是什么?中国AI企业为何纷纷开源自研框架?.pdf
1 报告标签:人工智能、深度学习、开源、框架 主笔人:谢子博 报告提供的任何内容(包括但不限于数据、文字、图表、图像等)均系头豹研究院独有的高度机密性文件(在报告中另行标明出处者除外)。未经头豹 研究院事先书面许可,任何人不得以任何方式擅自复制、再造、传播、出版、引用、改编、汇编本报告内容,若有违反上述约定的行为发生,头豹研究 院保留采取法律措施、追究相关人员责任的权利。头豹研究院开展的所有商业活动均使用“头豹研究院”或“头豹”的商号、商标,头豹研究院无任何前述名 称之外的其他分支机构,也未授权或聘用其他任何第三方代表头豹研究院开展商业活动。 中国人工智能行业调研简报 | 2021/042 头豹研究院是中国大陆地区首家B2B模式人工智能技术的互联网商业咨询平台,已形成集 行业研究、政企咨询、产业规划、会展会议行业服务等业务为一体的一站式行业服务体系, 整合多方资源,致力于为用户提供最专业、最完整、最省时的行业和企业数据库服务,帮助用 户实现知识共建,产权共享 公司致力于以优质商业资源共享为基础,利用大数据、区块链和人工智能等技术,围绕产业 焦点、热点问题,基于丰富案例和海量数据,通过开放合作的研究平台,汇集各界智慧,推 动产业健康、有序、可持续发展 300+ 50万+ 行业专家库 1万+ 注册机构用户 公司目标客户群体覆 盖率高,PE/VC、投 行覆盖率达80% 资深分析师 和研究员 2,500+ 细分行业进 行深入研究 25万+ 数据元素 企业服务 为企业提供定制化报告服务、管理咨询、战略调 整等服务 提供行业分析师外派驻场服务,平台数据库、报 告库及内部研究团队提供技术支持服务 云研究院服务 行业峰会策划、奖项评选、行业白皮书等服务 行业排名、展会宣传 地方产业规划,园区企业孵化服务 园区规划、产业规划 四大核心服务: 头豹研究院3 报告阅读渠道 2021LeadLeo 图说 表说 专家说 数说 头豹科技创新网 PC端阅读全行业、 千本研报 头豹小程序 微信小程序搜索“头豹”、手机扫上方二维 码阅读研报 添加右侧头豹研究院分析师微信,邀您进入行研报告分享交 流微信群 详情咨询4 人工智能行业 头豹调研简报 | 2021/04 Q1:如何实现深度学习算法的开发与应用?深度学习框架对人工智能应用的 开发及行业的发展所起到的作用是什么? 来源:头豹研究院编辑整理 深度学习框架打破技术门槛,打通技术交流渠道,促进业界协同发展 深度学习是以人工神经网络为基础、融合数学、计算机科学、神经科学等多种学科、对 数据及信息进行学习的机器学习算法。深度学习底层算法的开发对算法开发人员的要求 较高,需精通多个前沿科学领域理论并具备相对应的应用能力。由于较高的学术及技术 门槛,在深度学习技术发展早期缺乏底层开发工具的情况下,深度学习技术发展速度较 慢,相关应用的落地难以实现。 深度学习框架的出现打破了基于深度学习技术的人工智能应用开发的高技术门槛。深度 学习框架是一系列经过高级计算机语言封装的深度学习底层算法,内含可实现样本数据 的调用、分类及输入、神经网络架构建设、激活函数及损失函数等函数设置、超参数设 定及调整等功能的完整函数工具。通过对深度学习框架的引用,人工智能应用开发者无 需熟知底层算法开发逻辑即可完成应用开发,人工智能应用开发的技术门槛大幅降低。 深度学习框架的出现打通了业界技术交流与知识分享的渠道。采用同一深度学习框架的 算法程序具备较高的易读性及兼容性,使算法程序的移植及调用难度大幅降低。算法开 发人员可通过学习已开源的算法区块,并对该算法进行调用或进一步研发,在已有知识 架构体系的基础上实现人工智能算法的创新。 图表1:深度学习框架概述 样本处理 训练集 原始 样本 . . 测试集 . Batch A Batch N 神经网络构建 反向传播 样 本 数 据 的 调 用 与 分 类 深度学习神经网络 激活函数 f(z) w1,1 w2,1 参数 参数 神经网络结构设定 (层数及每层节点数) 反向传播算法 样 本 输 入 结 果 输 出 与 参 数 调 整 结果 预期 损失函数 f(cost) cost 损失/误差 超参数设定(学习率等) w 参数优化 Dropout 节点舍弃 *注:字体颜色为蓝色的部分为深度学习框架内涵算法5 人工智能行业 头豹调研简报 | 2021/04 Q2:在目前市场上已存在可开源利用的、由海外企业开发的成熟框架的背景 下,中国人工智能企业为何纷纷布局深度学习框架的自主研发及推广? 来源:头豹研究院编辑整理 现存深度学习框架在效率上的缺陷及日趋复杂的国际形势驱动中国人工智能企业布 局深度学习框架自主研发 中国人工智能企业布局深度学习框架的自主研发及推广的主要原因有二。一是目前业界 主流的深度学习框架在运算效率上尚有缺陷,主要体现在算法训练及推断阶段对GPU、 CPU等硬件的利用率较低。如何优化深度学习框架编写逻辑及计算机语言编译过程,从 而提升深度学习框架对硬件的利用率成为全球人工智能学术界及产业界亟需解决的问题, 也成为企业抢占人工智能行业高地的机会。具备更高效率的深度学习框架将成为替代现 存主流深度学习框架、推动企业人工智能生态构建的有力支持。 第二个原因则归咎于目前全球日益复杂的贸易环境。主流的深度学习框架虽已由全球各 大人工智能研发主体开源发布,其知识主权仍由各研发主体持有。受国际形势影响,已 开源的深度学习框架或将面临商用受限等风险。由于TensorFlow、PyTorch等由海外主体 研发并开源的深度学习框架已占据业界主流地位,框架商用受限将对业界生态、行业后 续发展及人工智能企业存续产生显著的负面影响。国际关系的日趋复杂迫使各国政府及 人工智能研发主体加强包括深度学习框架等核心技术的自主研发,从而掌握人工智能领 域发展的主动权。 0% 20% 40% 60% 80% 100% 训练 推断 TensorFlow PyTorch MXNet 0% 20% 40% 60% 80% 100% 训练 推断 TensorFlow PyTorch MXNet 主流深度学习框架GPU利用率 主流深度学习框架显存利用率 图表2:主流深度学习框架对GPU及显存的利用率,基于计算机视觉算法6 人工智能行业 头豹调研简报 | 2021/04 Q3:在知识产权愈发受到重视的今天,全球人工智能学术界及产业界为何纷 纷开源旗下自研的深度学习框架? 来源:头豹研究院编辑整理 开源是促进技术创新、业务增长及行业发展的关键驱动力 与程序及软件的开源类似,深度学习框架的开源指框架以开源许可证形式发行,任何主 体均有权进行查看、在其源代码基础上根据需求进行修改(生成新的代码)并加以应用。 围绕深度学习框架的开源,人工智能企业基于其强大的云服务实力及人工智能技术研发 实力,针对人工智能应用开发流程的简化及开发环境的优化为业界提供一系列人工智能 开发工具及服务,为人工智能业界的技术创新及协同发展提供有力支持。同时,深度学 习框架的开源与平台的建立为人工智能企业本身的技术创新、产品优化、应用拓展、人 才引进提供有力支持。深度学习框架的开源是建立成熟AI生态的核心引擎。 此外,深度学习框架的开源利好人工智能平台运营商付费业务的拓宽及增长。在以开源 深度学习框架为核心的免费服务基础上,人工智能平台运营商保留面向人工智能应用开 发商及需求方的付费服务。付费服务主要围绕算法、算力、数据与应用部署服务为业界 提供人工智能全流程开发支持,是人工智能平台运营商的主要收入来源。深度学习框架 的开源助力人工智能技术研发及应用落地的同时,推动人工智能生态的构建及应用领域 的拓宽,释放各应用领域智能化转型需求,为人工智能平台运营商付费业务的增长提供 有力支持。 图表3:人工智能开发平台商业模式 免 费 付 费 人 工 智 能 平 台 人工智能 应用开发商 人 工 智 能 平 台 人 工 智 能 平 台 独 立 开 发 者 人工智能 应用需求方 开源深度学习框架 人工智能算法训练计算资源(限时) 人工智能算法训练样本资源(限量) 人工智能算法开发基础模型及工具 人工智能算法开发基础教程 人工智能算法开发经验共享 人工智能创新理念共享 人工智能应用市场需求热点披露 人工智能技术人才引入 人工智能算法及应用潜在问题反馈 增值版深度学习框架及相关模型、开发工具组件及具备完善功能的预置算法 人工智能算法开发及部署服务(样本资源、计算资源、数据管理等) 人工智能应用开发全流程可视化管理服务及云端部署服务 可实现完整特定功能的人工智能解决方案7 人工智能行业 头豹调研简报 | 2021/04 Q4:已开源的深度学习框架有哪些?主流深度学习框架由哪些公司开发?中 国人工智能企业自研的开源框架与主流框架的差距在哪里? 来源:GitHub,头豹研究院编辑整理 图表4:深度学习框架开源简史 2013 2014 2015 2016 2017 2018 2019 2020 Darknet,Ali Farhadi DL4J,Eclipse Caffe,BVLC Theano,MILA Matconvnet,VLFeat MXNet,Apache Chainer,PFN Keras,Google PyTorch,Facebook Paddlepaddle,百度 CNTK,Microsoft Caffe2,BVLC Mace,小米 MNN,阿里巴巴 TNN,腾讯 MindSpore,华为 MegEngine,旷视 TensorFlow,Google 图表5:深度学习框架对比,截止至2021年4月19日 155.0 47.7 19.4 14.9 3.8 2.2 84.5 12.7 6.8 3.7 0.4 0.4 0 40 80 120 160 TensorFlow PyTorch MXNet Paddlepaddle MegEngine MindSpore GitHub星数 GitHub仓库复刻数 数量级:千 深度学习框架开源由来已久,TensorFlow及PyTorch占据业界主导地位 自2013年始,全球人工智能学术界及产业界各研发主体陆续开源旗下自主研发深度学习 框架,并以框架为主体搭建人工智能开放开发平台,推动人工智能产业生态的建立。其 中,由Google团队开发的TensorFlow及由Facebook团队开发的PyTorch两款深度学习框 架占据业界主导地位。 Jittor,清华大学 中国企业自研深度学习框架短期内实现国产替代难度较大 凭借较高的兼容性及较小的应用难度,TensorFlow、PyTorch两款深度学习框架成为业界 开发者的主流选择。由百度、小米、阿里巴巴、腾讯、华为、旷视科技等中国人工智能 企业自主开发并开源的深度学习框架起步较晚,在社区繁荣度、开发者数量、说明文件 丰富度等层面均不及TensorFlow与PyTorch,短期内难以实现对海外框架的全面替代。 ?id=6087df1f20410e968895ae728 人工智能行业 头豹调研简报 | 2021/04 方法论 头豹研究院布局中国市场,深入研究10大行业,54个垂直行业的市场变化,已经积累了近50万行 业研究样本,完成近10,000多个独立的研究咨询项目。 研究院依托中国活跃的经济环境,从人工智能、底层框架、开源生态等领域着手,研究内容覆盖 整个行业的发展周期,伴随着行业中企业的创立,发展,扩张,到企业走向上市及上市后的成熟 期,研究院的各行业研究员探索和评估行业中多变的产业模式,企业的商业模式和运营模式,以 专业的视野解读行业的沿革。 研究院融合传统与新型的研究方法,采用自主研发的算法,结合行业交叉的大数据,以多元化的 调研方法,挖掘定量数据背后的逻辑,分析定性内容背后的观点,客观和真实地阐述行业的现状, 前瞻性地预测行业未来的发展趋势,在研究院的每一份研究报告中,完整地呈现行业的过去,现 在和未来。 研究院密切关注行业发展最新动向,报告内容及数据会随着行业发展、技术革新、竞争格局变化、 政策法规颁布、市场调研深入,保持不断更新与优化。 研究院秉承匠心研究,砥砺前行的宗旨,从战略的角度分析行业,从执行的层面阅读行业,为每 一个行业的报告阅读者提供值得品鉴的研究报告9 人工智能行业 头豹调研简报 | 2021/04 法律声明 本报告著作权归头豹所有,未经书面许可,任何机构或个人不得以任何形式翻版、复刻、发表或 引用。若征得头豹同意进行引用、刊发的,需在允许的范围内使用,并注明出处为“头豹研究院”, 且不得对本报告进行任何有悖原意的引用、删节或修改。 本报告分析师具有专业研究能力,保证报告数据均来自合法合规渠道,观点产出及数据分析基于 分析师对行业的客观理解,本报告不受任何第三方授意或影响。 本报告所涉及的观点或信息仅供参考,不构成任何证券或基金投资建议。本报告仅在相关法律许 可的情况下发放,并仅为提供信息而发放,概不构成任何广告或证券研究报告。在法律许可的情 况下,头豹可能会为报告中提及的企业提供或争取提供投融资或咨询等相关服务。 本报告的部分信息来源于公开资料,头豹对该等信息的准确性、完整性或可靠性不做任何保证。 本报告所载的资料、意见及推测仅反映头豹于发布本报告当日的判断,过往报告中的描述不应作 为日后的表现依据。在不同时期,头豹可发出与本报告所载资料、意见及推测不一致的报告或文 章。头豹均不保证本报告所含信息保持在最新状态。同时,头豹对本报告所含信息可在不发出通 知的情形下做出修改,读者应当自行关注相应的更新或修改。任何机构或个人应对其利用本报告 的数据、分析、研究、部分或者全部内容所进行的一切活动负责并承担该等活动所导致的任何损 失或伤害10 备注:活动解释权均归头豹所有,活动细则将根据实际情况作出调整。 头豹 Project Navigator 领航者计划介绍 每个季度,头豹将于 网站、公众号、各自 媒体公开发布季度招 募令,每季公开 125个 招募名额 头豹共建报告 2021年度特别策划 Project Navigator 领航者计划 头豹邀请沙利文担任计划首 席增长咨询官、江苏中科院 智能院担任计划首席科创辅 导官、财联社担任计划首席 媒体助力官、无锋科技担任 计划首席新媒体造势官、 iDeals担任计划首席VDR技 术支持官、友品荟担任计划 首席生态合作官 头豹诚邀各行业 创造者、颠覆者 领航者 知识共享、内容共建 头豹诚邀政府及园区、 金融及投资机构、 顶流财经媒体及大V 推荐共建企业 共建报告流程 企业申请共建 头豹审核资质 确定合作细项 信息共享、内容共建 报告发布投放11 备注:活动解释权均归头豹所有,活动细则将根据实际情况作出调整。 头豹 Project Navigator 领航者计划与商业服务 头豹以研报服务为切入点,根据企业 不同发展阶段的资本价值需求,以传 播服务、FA服务、资源对接、IPO服 务、市值管理为基础,提供适合的 商业管家服务解决方案 头豹以研报服务为切入点,根据企业 不同发展阶段的资本价值需求,以传 播服务、FA服务、资源对接、IPO服 务、市值管理为基础,提供适合的 商业管家服务解决方案 FA服务 提升企业估值 协助企业融资 传播服务 塑造行业标杆 传递品牌价值 研报服务 共建深度研报 撬动精准流量 IPO服务 建立融资平台 登录资本市场 市值管理 提升市场关注 管理企业市值 资源对接 助力业务发展 加速企业成长 扫描上方二维码 联系客服报名加入12 读完报告有问题? 快,问头豹!你的智能随身专家 STEP01 人工智能NLP 技术 精准拆解用户提问 智能拆解提问 千元预算的 高效率轻咨询服务 STEP02 云研究院7 24 待命 随时评估解答方案 云研究院后援 STEP03 大数据定制调研 迅速生成解答方案 解答方案生成 STEP04 书面反馈、分析师专访、 专家专访等多元化反馈方 式 专业高效解答 扫码二维码 即刻联系你的智能随身专家