欢迎来到报告吧! | 帮助中心 分享价值,成长自我!

报告吧

换一换
首页 报告吧 > 资源分类 > PDF文档下载
 

海天瑞声:训练数据小巨人资源库领头羊.pdf

  • 资源ID:123119       资源大小:1.82MB        全文页数:35页
  • 资源格式: PDF        下载积分:15金币 【人民币15元】
快捷下载 游客一键下载
会员登录下载
三方登录下载: 微信开放平台登录 QQ登录  
下载资源需要15金币 【人民币15元】
邮箱/手机:
温馨提示:
用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,下载共享资源
 
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,既可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

海天瑞声:训练数据小巨人资源库领头羊.pdf

1 证券研究报告 作者: 行业评级: 上次评级: 行业报告 | 请务必阅读正文之后的信息披露和免责申明 计算机 强于大市 强于大市 维持 2021年 08月 12日 ( 评级) 分析师 缪欣君 SAC执业证书编号: S1110517080003 海天瑞声:训练数据小巨人,资源库领头羊 行业深度研究 摘要 2请务必阅读正文之后的信息披露和免责申明 1.海天瑞声是国内领先的训练数据提供商。 主要从事训练数据的研发设计、生产及销售业务。凭借丰富的技术积累和行业经验, 公司已成为同时具备核心技术、产品资源、优质客户为一体的本土训练数据提供企业; 高管团队及技术人员实力雄厚,在各自领 域具有深厚的技术积累,能够前瞻性地把握行业发展方向。 公司主营业务收入的核心来源为 数据 资源定制服务, 2020年占比 50%,公司国内业务占比逐年增加, 2020年占比 64%。 2. 公司主营专业数据集,致力于建立技术壁垒: 海天瑞声主要经营专业训练数据集 ,持续增加研发投入,筑高技术壁垒。 公司投 入了每年总营业收入将近 20%的费用进行研发, 在众多主流 AI 产品及终端应用的训练过程中,实现多项终端应用场景覆盖,公 司训练数据提取在业内具有较强的专业技术水平优势,正在积极与对手拉开技术代差,形成“护城河”。 3. 海天瑞声位于中国语音类基础数据服务领域首位。 公司占国内 AI基础数据服务行业,市场份额约 8%,行业排名前五,紧随百 度众包之后,成为国内市场第二大基础数据服务提供企业。 4. AI技术数据服务市场高景气, 2020年国内 总销售额约为 36亿元,同比增长 20%。 近年全球人工智能商业价值稳定增长,因此 全球人工智能市场规模保持稳定上涨, 2020年已实现总销售额 501亿美元。 风险提示 :市场竞争加剧的风险、收入主要来自老客户,新客户收入占比较低的风险、专利被申请宣告无效的风险、核心技术快 速迭代风险、核心技术人员流失风险、核心技术失密风险、采购成本上升风险、数据安全相关风险等 目录 3请务必阅读正文之后的信息披露和免责申明 1. 海天瑞声:训练数据专业提供商 1.1 公司概况:国内领先的训练数据专业提供商 1.2 主营业务 :致力于为 AI产业链的机构提供专业数据集 1.3 业务类型 : 公司主营训练数据业务,细分为三条产品业务线 1.4 财务基本情况:总体营收与净利润保持稳定 1.5 收入拆分:训练数据产品国内营收创新高,占比逐步回升 1.6 费用分析:持续增大研发投入,不断筑高技术壁垒 1.7 高管 & 技术团队:拥有名校背景及知名公司经历 1.8 客户情况:前五大客户销售占比超 50%,老客户群较为固定 2.公司主要产品:训练数据服务 2.1 主要产品:训练数据产品及服务 2.2 主要应用技术:训练数据专业提供商 三大 AI核心领域 2.3 主要业务 流程:数据服务采购执行与销售流程 3. 人工智能基础数据服务行业分析 3.1 中国 AI基础数据服务行业产业链全梳理 3.2 发展态势:国家产业政策助力行业稳步发展 3.3 人工智能行业市场规模: 市场规模持续增长 3.4 AI基础数据服务行业市场规模:人工智能市场扩张带动发展 3.5 行业数据量:训练数据总量高速增长 3.6 行业市场需求:训练数据需求增长 3.7 竞争格局:训练数据供应集中化 3.8 市场地位:中国语音类基础数据服务领域首位 4. 风险提示 海天瑞声:训练数据专业提供商 1 4请务必阅读正文之后的信息披露和免责申明 1.1 公司概况:国内领先的训练数据专业提供商 . 公司基本信息 资料来源:公司招股书,天风证券研究所 5 公司名称: 北京海天瑞声科技股份有限公司( Beijing Haitian Ruisheng Science Technology Ltd.) 成立日期: 2005 年 05 月 11 日( 北京 ) 2005年,贺琳和俞舸签署 北京海天瑞声科技有限公司章程 ,共同出资设立海天瑞声有限。根据该章程,海天 瑞声有限注册资本为 30 万元,其中,贺琳以货币出资 27 万元,占注册资本的 90%;俞舸以货币出资 3 万元, 占注册资本的 10%。 图 1:公司发展历程及荣誉 图 2:公司成立时注册资本构成比例 2017年 贺琳,俞舸共同出资设 立 北京海天瑞声科技股 份有限公司 2005年 年度 人工智能 数据 服务领域 领军企业 2018年 智能语音 创新大赛行业 先锋奖 , 2018 年人工 智能行业最佳产品 2020年 专精特新 “ 小 巨人 ” 企业 2021年 新一代人工智能 产业创新 重点任 务揭榜 优胜单位 90% 10% 贺琳 俞舸 1.2 主营业务:致力于为 AI产业链的机构提供专业数据集 . 公司主营业务 6 占 比 公司主营业务 :公司主要从事训练数据的研发设计、生产及销售业务。 公司相关产品和服务主要应用于 软件和信息 技术服务业。 公司始终贯彻培养自身研发核心技术为要领,通过基础研究与实际应用的紧密 结合,自主开发了一体化数据处理平 台,在 基础研究、平台工具、训练数据生产 三个维度均积累下核心技术,并且以前瞻性的 专业数据集设计能力 、丰 富的 语言覆盖能力及场景采集能力 ,以及 AI 辅助标注及精细标注能力 共同搭建起 训练数据开发一站式解决方案 ,大 幅提升开发效率、服务质量及数据安全性, 为 下游客户 提供高质量的训练数据产品、高效率的训练数据定制服务及 高水准的训练数据相关应用服务。 资料来源:公司招股书,天风证券研究所 算法与数据处 理技术并用 截至 2020 年 12 月 31 日 , 公司已积累 760 余个自有知识产权 的训练数据产品 , 可提供超过 160 余个语种 /方言 的训练数据 。 工具和平台共建 融入项目流程 管理 、 质量把控 、 数据安全管理 , 嵌入生产所需的各类工具 、 软件模块 深厚积累于语 音语言学基础 研究方面 公司已经取得 24 项发明专利 、 1 项实用新型专利授权及 1 项外 观设计专利授权 , 134 项计算机软件著作权 , 另有 2 项专利已提 交申请 。 图 3:公司三大核心技术 1.3 业务类型:公司主营训练数据业务,细分为三 条产品 业务 线 7 . 公司专注于为 AI 产业链上的各类机构提供算法模型开发训练所需的专业数据集。 公司提供的训练数据覆盖智能语 音 (语音识别、语音合成等 )、计算机视觉、自然语言等多个核心领域,全面服务于人机交互、智能驾驶、智慧城 市等多种创新应用场景。 公司研发生产的训练数据主要运用于人工智能算法模型开发训练,产品服务形式包括 训练数据定制服务、训练数 据产品及相关的应用服务。 主要 业务类型 资料来源:公司招股书,天风证券研究所 产品服务 矩阵 训练数据定制服务 通过采集大量数据,比如声音、文本、图像、视频, 以提供定制化数据运用场景(定制分为两类:一类 是采集加工,一类是纯加工) 训练数据产品 公司开发并授权客户使用训练数据集成品,公 司拥有 多次销售使用权(标准化数据集) 训练数据相关的应用服务 公司负责根据客户需求提供 后续产品服务 ,如 用户界面、软件等 训练数据运用场景 由于智能音箱使用人群年龄层跨 度大,由少儿覆盖到老年人群, 公司在训练数据集的设计过程中 需要充分考虑方言的分布以及不 同声音的语言环境。考虑的因素 由年龄层次和发音特点组成。 图 4:产品应用场景 图 5:产品服务类型 1.4 财务基本情况:总体营收与净利润保持稳定 资料来源: wind、公司招股书 、天风证券研究所 8 占 比 总体营收较 2018年涨势明显: 2018-2020年总营业收入分别为 19265.77万元 , 23755.81万元和 23337.4万元 , 2018年至 2019年同比增长率为 23%, 三年净利率分别为 34.84%, 34.34%和 35.17%, 总体净利润较为稳定 。 净利润 涨势与总营收表现持平: 2018-2020年 , 海天瑞声净利润分别为 6713.07万元 , 8158.68万元和 8208.1万 元 , 2018年至 2019年 同比 增长率为 22%。 . 营业收入 图 6: 2018-2020年营业总收入(万元) 图 7: 2018-2020年净利润(万元) 19266 23756 23337 23% -2% -5% 0% 5% 10% 15% 20% 25% 0 5000 10000 15000 20000 25000 2018A 2019A 2020A 营业收入(万元) 同比增长率( %,右轴) 6713 8159 8208 22% 1% 0% 5% 10% 15% 20% 25% 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 2018A 2019A 2020A 净利润(万元) 同比增长率( %,右轴) . 1.4 财务基本情况: 毛利率 保持稳定,均超过 65% 公司毛利率 保持稳定 , 已将近 70%。 2018-2020年 毛利率 分别为 64.77%, 70.25%和 67.70%, 公司的训练数据 产品业绩稳扎稳打 。 毛利率 图 9: 2018-2020年公司毛利率稳定上升图 8: 2018-2020年公司毛利润(万元) 9资料来源: wind、公司招股书 、天风证券研究所 12,478 16,688 15,799 34% -5% -10% -5% 0% 5% 10% 15% 20% 25% 30% 35% 40% 0 2000 4000 6000 8000 10000 12000 14000 16000 18000 2018A 2019A 2020A 毛利润 同比增长率( %,右轴) 65% 70% 68% 62% 63% 64% 65% 66% 67% 68% 69% 70% 71% 2018A 2019A 2020A . ; 营业收入主要构成 公司营收主场为国内地区, 2020年国内营收涨幅较高。 2019年至 2020年公司国内营业收入同比增长率已上升至 25.01%。 2018-2020年国内总营业收入分别为 13293.77万元, 11973.75万元, 14968.83万元。 公司海外业务收入 2019年增幅明显,营收占比已恢复如初。 2018-2020年,海天瑞声海外营收分别是 5972万元, 11782.07万元, 8368.56万元,占总营收比重分别为 31%, 50%, 36%, 2020年海外收入受疫情影响,占比浮 动较大。 10 1.5 收入拆分:训练数据产品国内营收创新高,占比逐步回升 图 10: 2018-2020年公司国内外业务收入及占比 图 11: 2018-2020年公司国内外业务收入及占比 资料来源: wind、公司招股书 、天风证券研究所 13294 11974 14969 5972 11782 8369 0 2000 4000 6000 8000 10000 12000 14000 16000 2018A 2019A 2020A 中国大陆营业收入(万元) 国外营业收入(万元) 69% 50% 64% 31% 50% 36% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 2018A 2019A 2020A 中国大陆营业收入占比 国外营业收入占比 11 1.5 收入拆分:数据库产品服务收入占比逐年升高,已达 46% . ; 公司核心来源为数据资源定制服务, 2020年占比约 50%。 定制服务产品营收较为稳定, 2018年至 2020年销售额分 别为 12369.55万元, 14232.91万元, 11729.91万元。 公司数据库产品服务占比在逐年上升,营收占比将与数据资源定制服务相持平。 2018-2020年该项服务营收分别为 6601.67万元, 9167.47万元, 10613.71万元,占总营收比重分别为 34.27%, 38.63%, 45.48%。 公司数据库资源相关服务占比小幅提升。 2018年至 2020年占总营收比重由 1.53%增长为 4.26%。 营业收入主要构成 图 12: 2020年公司训练数据产品销售收入占比 图 13: 2018-2020年训练数据产品销售收入 资料来源:公司招股书 、天风证券研究所 数据资源定制 服务 50% 数据库产品服务 46% 数据资源相关的 应用服务 4% 6602 9176 10614 12370 14233 11730 295 346 994 0 2000 4000 6000 8000 10000 12000 14000 16000 2018A 2019A 2020A 数据库产品收入(万元) 数据资源定制服务收入(万元) 数据资源相关的应用服务收入(万元) 1.6 费用分析:持续增大研发投入,不断筑高技术壁垒 12 重视研发团队建设,研发技术人员比例几近 70%。 截止 2020年 12月 31日,公司总人数 151人,研发与技术人员数量 达 103人, 占公司总人数比例达 68.21%。 筑高技术壁垒,高研发费用。 公司 2018-2020年研发费用分别为 2734.32万元, 4169.61万元和 4349.75万元,占 总营业收入的比例分别为 14.19%、 17.55%、 18.64%, 公司 2018-2020年的研发费用逐年递增,占营业收入比重 皆超过 10%,现已高达至 19%。 . 图 14: 2018-2020年销售、管理、研 发、财务费用数额(万元) 图 16:公司 2018-2020年的研发费用占营业收入比重逐步增加 资料来源: wind、公司招股书 、天风证券研究所 874 925 1113 2181 3156 2567 2735 4170 4350 113 150 215 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 2018A 2019A 2020A 销售费用 管理费用 研发费用 财务费用 费用投入主要构成 53% 31% 14% 3% 研发费用 管理费用 销售费用 财务费用 图 15:公司 2020年研发费用占比已达 53% 14% 18% 19% 0% 2% 4% 6% 8% 10% 12% 14% 16% 18% 20% 2018A 2019A 2020A 13 1.7 高管 & 技术团队:拥有名校背景及知名公司经历 高级 管理 人员 核心 技术 人员 姓名 职务 任职期限 唐涤飞 董事、总经理 2017 年 11 月 至 2020 年 11 月 李科 董事、副总经理 2017 年 11 月 至 2020 年 11 月 吕思遥 副总经理、董事会秘书 2017 年 11 月 至 2020 年 11 月 黄宇凯 董事、技术总监 2019 年 1 月 至 2020 年 11 月 郝玉峰 副总经理、技术总监、首席科学家 2017 年 11 月 至 2020 年 11 月 姓名 职务 其他信息 李科 董事、副总经理 1981 年 8 月出生 , 清华大学信息与信号处理专业硕士 黄宇凯 董事、副总经理、技术总监 1983 年 5 月出生,复旦大学计算机科学与技术专业硕士 郝玉峰 副总经理、技术总监、首席科学家 1974 年 5 月出生,东南大学生物医学工程专业博士 曹琼 计算机视觉业务部总监 1982 年 10 月出生,北京航空航天大学检测技术与自动化装置专业博士 邵志明 高级研发工程师 1987 年 12 月出生,北京邮电大学模式识别专业硕士 创 始 人 员 董事长 贺琳 1968 年 7 月出生,毕业于 北京 大学 ,曾任职于 中国科学院声学 研究所 ,先后参与“汉语人 - 机 语音对话系统工程”、“汉语语 音参数合成”等 国家自然科学基 金重点项目 、 国家八六三计划智 能计算机主题项目和中国科学院 “八五”重大项目, 海天瑞声创 始人,现任公司董事长。 总经理唐涤飞 1970 年 12 月出生, 中国科学技 术大学通信与电子系统专业工学 硕士 ,曾任联想集团技术中心项 目负责人,微软中国研发中心中 文技术部项目经理, 微软亚洲工 程院资深项目经理 ,阿里巴巴云 计算公司数据应用与服务、无线 平台的产品及项目总监, 海天瑞 声,现任公司董事、总经理。 资料来源:公司招股书,天风证券研究所 1.8 客户情况:前五大客户销售占比超 50%,老客户群较为固定 . 客户情况 14 占 比 年份 前五大客户销售金额 (万元) 占营业收入比例 2020年 度 11726.03 50.25% 2019年度 12798.80 53.88% 2018年度 11378.06 59.06% 国内主要客户小幅变动,境外收入因年而异: 公司客户销售占比情况逐年更替,海外市场主要客户变动明显, 微软销售占比逐年增高,三星销售额陡然递减,由 2019年 4762.96万元缩减至 2020年 1383.66万元。 前五大客户销售占比超 50%,老客户较为稳定: 2018-2020年前五大客户销售占比皆超过 50%,且不存在依赖 特定客户的情形, 2018-2020年, 微软、阿里巴巴、腾讯、三星 稳定居于公司前五大客户,微软于 2020年为公 司第一客户,营业收入占比 18.56%。 表 1:前五大客户营收比例 图 17:前五大客户营收比例趋势变化 资料来源:公司招股书,天风证券研究所 . 2020前五大客户 59% 54% 50% 44% 46% 48% 50% 52% 54% 56% 58% 60% 2018A 2019A 2020A 公司主要产品:训练数据服务 2 15请务必阅读正文之后的信息披露和免责申明 根据 客户需求 设计训练数据 及结构 组织原料数据 采集 对采集原料数 据 加工 定制化 训练 数据集 . 2.1 主要产品:训练数据专业提供商 训练数据定制服务 公司是我国人工智能领域标杆企业,在基础数据服务行业具备高影响力。 训练数据定制服务为专属客户单独研发, 客户将享有最终生成的训练数据的知识产权,公司不可将此类业务生产的训练数据向其他客户重复销售。 此项产品服务将根据客户定制化需求,优先按照初始计划生产部分数据,客户通过后续反馈方案决定是否更改数 据定制需求,并重新确定新的解决方案。 训练数据定制服务 资料来源:公司招股书,天风证券研究所 16 采 集 + 加 工 服 务 纯 加 工 服 务 客户提供原料数据 发行人根据客户需求 进行加工 定制化训练数据集 客户享 有 最终 形成的 训练数 据集成 品的 知 识产权 公司开发自有知识产权的训练数据产品,通过销售训练数据产品的使用授权许可,获取让渡资产使用权收入。 此类训练数据集一经开发完成,公司可多次销售并获取授权许可收入。 2.1 主要产品:训练数据专业提供商 训练数据产品 . 训练数据产品 资料来源:公司招股书,天风证券研究所 17 通过市场需求预 判发展趋势 评估算法技术应 用前景 开发训练数据产 品 满足算法模型对 模拟场景的学习 需要 授权客户使用完 成品 可重复多次销售 使用权 数据文档 音频文件 标注文件 说明文档 训练数据设计文档 音素集说明 标注规范文件 技术文档 发音词典 音频文件参数统计信 息 训练数据场景设置参 数文件 发音人信息文件(非 敏感) 训练数据 产品流程 训练数据集成品结构 (以语音数据集为例) 2.1 主要产品:训练数据专业提供商 训练数据相关的应用服务 资料来源:公司招股书、天风证券研究所 18 占 比 公司基于其生产的训练数据提供算法模型相关的训练服务,运用训练数据研发能力助力下游客户完成其算法模型 的语言拓展、特定算法模块拓展、垂直应用领域拓展等,为客户定制针对特定应用场景的专属算法模型,提高 AI 技术应用效果。 . 训练数据相关的应用服务 开发特定应用领域的算法模型 为客户算法模型实现覆盖能力拓 展 实现后续落地运用过程所需界面 基于客户通用算法模型 为客户定制开发特定语种 /方言 使用特定语种 /方言、特定应用领域的训 练数据 对客户的算法模型进行训练 满足其在特定应用领域的运用需要 客户负责研发 /提供核心的算法模型 公司完成运用过程所需的用户界面、软 件及相关的系统集成工作 2.2 主要应用技术:训练数据专业提供商 三大 AI核心领域 19 占 比 . 公司提供的训练数据广泛应用于众多主流 AI 产品及终端应用的训练过程中,覆盖了个人助手、语音输入、智能家居、智能客服、机器人、语音导航、智能播报、语音翻译、自动驾驶、智慧交通、智慧城市、机器翻译、智能问答、信息 提取、情感分析、 OCR 识别等多种应用场景。 主要产品服务的终端应用场景 资料来源:公司招股书、天风证券研究所 训练数据产 品 智能语音 语音识别 语音识别采 集 语音识别转 写 语音合成 计算机视觉 计算机视觉 自然语言 自然语言 训练数据 定制服务 语 音 识 别 语 音 合 成 计算机视觉技术应用实例 人脸识别 2.3 主要业务流程 采购流程 20资料来源:公司招股书、天风证券研究所 预算管理 需求部门提出采购申请 部门直属负责人审批 部门分管负责人审批 采购部审批 采购部选择采购方式,甄 选供应商 签署采购合作协议 供应商提供服务 验收及结算 预算管理 需求部门提出采购申请 部门直属负责人审批 部门分管负责人审批 人力资源部审批 人力资源部选择采购方式, 甄选供应商 签署采购合作协议 供应商提供服务 验收及结算 预算管理 需求部门提出采购申请 行政部汇总并拟定采购 申请单 行政部主管、财务部预 算会计审核(预算外的 另由需求部门总负责人、 行政部总监、财务总监 及总裁审核) 根据采购申请单拟定的 采购方式选择采购程序 并实施 验收入库 结算 数 据 服 务 采 购 岗 位 服 务 采 购 其 他 采 购 采购部 建立业 务采购 价格体 系 人力资 源部建 立业务 采购价 格体系 2.3 主要业务流程 数据服务采购执行与销售流程 21资料来源:公司招股书、天风证券研究所 售后跟踪及服务 合同执行完毕 项目立项及执行 合同签署 项目报价及投标 客户确认 项目方案制定 /训练数据集产品推荐 训练数据集开发需求分析 客户意向收集及确认;市场需求研判 数据 支持 销售 部合 同报 价 数据 中心 评估 成本 分阶 段收 款 项目 持续 跟踪 销售 流程 数据服务采购执行流程 签署框架 协议 A 确定项目 供应商 B 确定采购 量,下达 采购通知 CD 根据资源 状况确定 单价 E 项目执行 FGH 验收结算 I . 数据服务采购质量控制 公司采取的质量控制措施能够保证供应商提供的数据满足其采集需 求,同时采购模式符合公司的业务特点和行业惯例,具备合理性。 行业分析 3 22请务必阅读正文之后的信息披露和免责申明 3.1 中国人工智能基础数据服务行业的的产业链图谱 资料来源:艾瑞咨询、公司招股书、天风证券研究所 23 下游 AI算法研 发 中游 训练数据 的生产 上游 数据才产 生及产能 资源 科技公司 AI公司行业企业 科研单位 AI基础数据服务商 人力资源服务公司 技术服务公司个人 企事业单位 政府机构 数据生产者 数据生产组织者 3.2 AI基础数据服务行业发展态势:国家产业政策助力行业稳步发展 24资料来源:公司招股书 、天风证券研究所 2010 年 2015 年 2016 年 2017 年 2018 年 国务院 加快建设宽 带、 安全的 信息网略基 础设施 国务院 瞄准新一代 信息 技术 、高端装备、 新材料、生物医 药等战略重点 国务院 支持 新一代信息技 术、 新能源汽车、 生物技术、绿色低 碳等产业链 国家发改委 人工智能首次 进入 指导目录名单,包 括面向社会开放的 文本、语音、图像 国家电子技术标准化 研究院 全面推进 人工智能 标 准化工作,促进产业 发展 2019 年 2019 年 2020 年 2020 年 2021 年 中央全面深化 改革委 促进 人工智能 和实体经济深 度融合 科学技术部 明确指出”开放、 共享“重要理念 国务院 首次将 ”数据“ 作 为市场化要素写入 国家顶层设计级别 文件 国家发改委 加强 人工智能 领域 标准化顶层设计 十三届全国人大四 次会议 十四五规划 指 出要 加快数字化发 展 . 3.3 人工智能行业市场规模:市场规模持续增长 资料来源:公司招股书、国际数据公司( IDC )、天风证券研究所 25 占 比 全球人工智能市场规模稳定扩张。 基础数据服务行业人工智能行业发展情况息息相关,在近年来全球 AI产业基本保 持稳定向好的发展态势下, 2020年至 2024年复合增长率将提升至 21.73%。 国内 人工智能 市场规模持续增长。 截至 2019 年年末,中国 (不含港澳台 )活跃 AI 企业达到 1,189 家,占全球总数的 22.08%,位居全球第二; 2019 年,中国人工智能行业的融资总额 约为 166 亿美元,占全球的 44.39%,位居全 球首位。 图 18: 2020-2024年全球人工智能市场规模不断上升 图 19: 2019-2024年国内人工智能市场规模逐年上升 501 1100 0 200 400 600 800 1000 1200 2020A 2024E 全球人工智能行业市场规模(亿美元) 市场规模 46 63 89 116 147 172 37% 42% 30% 27% 17% 0 20 40 60 80 100 120 140 160 180 200 0% 5% 10% 15% 20% 25% 30% 35% 40% 45% 2019A 2020E 2021E 2022E 2023E 2024E 中国人工智能市场规模(亿美元) 同比增长率( %,右轴) 3.4 AI基础数据服务行业市场规模:人工智能市场扩张带动发展 资料来源:公司招股书、艾瑞咨询、天风证券研究所 26 占 比 全球人工智能行业高速发展助长国内 AI基础数据服务行业市场规模扩增。 公司营业收入受益于中国 AI基础数据服务 行业市场规模稳步增长, 2020年市场规模预计达 36亿元,增长率常年稳定于 20%。 当前我国人工智能产业加速发展,从基础支撑、核心技术到行业应用的产业链条基本形成,一批创新活跃、特色鲜 明的创新企业加速成长,新模式、新业态不断涌现,整体呈现蓬勃发展态势。政策支持、投资引导和巨头布局将推 动中国 AI 产业的结构调整,进一步扩大市场规模。 . 图 20: 2018-2025年国内 AI基础数据服务行业市场规模逐年扩增表 2: 2019年中国与全球人工智能行业发展情况对比 市场规模 项目 全球 中国 论文数 AI领域论文发布数量占全部论文的 3% 中国 AI领域论文发布数量占全部论文的 28% 人才数 /高级人才 数 博士 22,000名 /专家 5,400名 博士 413名 /专家 120名 活跃企业数 5,386家 1,189家 融资总额 约 374亿美元 约 166亿美元 2009-2019年 AI 相关专利申请 448,684项 66,508项 26 31 36 43 51 61 77 101 20% 18% 18% 19% 21% 25% 32% 0% 5% 10% 15% 20% 25% 30% 35% 0 20 40 60 80 100 120 2018A 2019A 2020E 2021E 2022E 2023E 2024E 2025E 中国 AI基础数据服务行业市场规模(亿元) 同比增长率( %,右轴) 3.5 AI基础数据服务行业数据量:训练数据总量高速增长 资料来源:公司招股书、国际数据公司( IDC )、天风证券研究所 27 占 比 全球 数据量呈指数型增长。 据国际数据公司 (IDC)预测,全球每年的数据量将从 2018 年的 33ZB 快速增加到 2025 年的 175ZB, 年复合增长率达 26.91%。其中,中国的数据量增速最快,平均每年的增长速度比全球快 3%。 2018 年,中国的数据量为 7.6ZB, 占全球总量的 23.4%,预计到 2025 年将增至 48.6ZB, 占全球总量 的 27.8%,年复合增长率达 30.35%。 . 33 175 0 20 40 60 80 100 120 140 160 180 200 2018A 2025E 全球数据量( ZB) 7.6 48.6 0 10 20 30 40 50 60 2018A 2025E 中国数据量( ZB) 图 21: 2018-2025年全球数据量增长趋势 图 22: 2018-2025年中国数据量增长趋势 数据量 . 3.6 AI基础数据服务行业市场需求:训练数据需求增长 资料来源:公司招股书、 Dimensional Research、天风证券研究所 28 占 比 全球基础数据服务行业处于快速成长期,市场规模具有较大的增长空间。 应用场景的创新和机器学习算法的流行 直接带动了训练数据需求的大幅增长,得益于训练数据需求增长和对外采购意识的形成,全球基础数据服务行业 进入快速成长期,市场规模具有较大的增长潜力。 43% 28% 19% 10% 10万 -100万 少于 10万 100万 -1000万 大于 1000万 66% 51% 50% 28% 27% 4% 0% 10% 20% 30% 40% 50% 60% 70% 数据偏差或错误 数据量不足 数据不可直接使用 缺少标注团队 缺少标注工具 未曾遇到问题 图 23:训练数据需求量 图 24:受访者遇到的与数据相关的难题及比例 训练数据需求 . 3.7 AI基础数据服务行业竞争格局:训练数据供应集中化 资料来源:公司招股书、艾瑞咨询、天风证券研究所 29 占 比 中小数据供应商是市场中的主要供应力量。 品牌数据服务商、中小数据供应商和需求方自建基础数据团队构成市场 竞争关系,为基础数据服务市场的主要供应方,在 2019 年市场规模中的份额占比分别为 30.4%、 47.0%和 22.6%。未来随着训练数据的难度和精度要求越来越高,及对数据安全的要求越来越严, 有向品牌集中的趋势。 中国基础数据服务行业的市场需求可以分为图像类数据需求、语音类数据需求和自然语言处理类数据需求。 2019 年,图像类、语音类和 自然语言处理类数据需求规模占比分别为 49.7%、 39.1%和 11.2%。 49.70% 39.10% 11.20% 图像类数据需求 语音类数据需求 自然语言处理类数据需求 47.00% 30.40% 22.60% 中小数据供应商 品牌数据服务商 需求方自建团队 图 26: 2019年中国 AI基础数据服务行业需求类型图 25: 2019年中国 AI基础数据服务行业供应方格局 行业竞争格局 . 3.8 公司市场地位: 中国语音类基础数据服务领域首位 市场地位 资料来源:公司招股书、天风证券研究所 30 公司是中国语音类基础数据服务领域的 头部企业 ,在中国语音类基础数据服务领域企业中营收份额占比排名第 一。中国基础数据服务行业提供语音类数据产品和服务的供应门槛高于图像类数据,行业内的主要企业由 Appen Limited, AIMMO, Baobab, Globalme, DefinedCrowd, Scale AI,慧听科技,标贝科技组成。 1996 年成立于澳大利亚 高质量人工标注数据集的提供商 机器学习 人工智能开发 技术公司 汽车公司 电子商务公司 政府部门 语音识别 、合成 、评测 北京慧听科技有限公 司成立于 2011 年 语音训练数据制作 音乐数据制作标注 标贝 (北京 )科技有限 公司成立于 2016 年 提供智能语音交互服务 语音合成整体解决方案 语音合成、识别、图像 识别 图 27:行业内的主要企业与产品服务提供 语音识别、合成、计算 机视觉 北京海天瑞声科技股份有 限公司成立于 2005 年 语音训练数据设计、采 集、加工、质检 覆盖 16类终端应用场景 . 3.8 公司市场 地位 :公司市场份额约 8%,行业排名前五 市场份额占比 中国 AI基础数据服务行业仍处于低集中竞争阶段,行业活力充足,发展空间较大。 现阶段国内基础数据服务商以 提供图像类数据和语音类数据服务的公司为主。图像类数据业务内容涉及人像数据、 OCR 数据、自动驾驶数据 等, 百度众包在图像类基础数据服务领域的营收份额占比最高 。 语音类数据产品和服务的供应门槛高于图像类数据,业务内容包含语音识别数据、语音合成数据等, 海天瑞声在 语音类基础数据服务领域的营收份额占比最高。 图 29: 2019 年基础数据服务行业前五大企业的市场份额占比 企业 3、企业 4、企业 5对应的企业包括标贝科技、云测信息和数据堂,未获得上 述三家企业具体排名情况 图 28: 2019年中国人工智能基础数据服务行业市场份额占比 31资料来源:公司招股书、艾瑞咨询、天风证券研究所 其他服务商 74% 前五大服务商 26% 11% 8% 2%-3% 2%-3% 1%-2% 0% 2% 4% 6% 8% 10% 12% 百度众包 海天瑞声 企业 3 企业 4 企业 5 对应市场份额占比 风险提示 4 32请务必阅读正文之后的信息披露和免责申明 33 风险提示: 市场竞争加剧风险 公司所在的细分领域为人工智能基础数据服务领域。公司竞争对手不断增多,导致市场竞争 加剧。公司如果不能持续有效地制定并实施业务发展规划,则将受到竞争者的挑战,从而面 临市场竞争加剧而导致的经营状况下滑、市场地位下降和可能失去主要客户的风险,进而影 响公司的盈利能力和发展潜力。 收入主要来自老客户,新客户收入占比较低的风险 专利被申请宣告无效的风险 核心技术快速迭代风险 由于人工智能行业整体发展较为迅速,应用领域和应用场景不断拓展,下游需求随着行业发 展不断发生变化,公司进行数据开发所需的各项技术也面临着快速迭代更新的风险。 核心技术人员流失风险 随着行业的持续发展,行业内企业之间对于高端人才的竞争日益激烈,如果公司无法持续加 强核心技术人员的培养及引进并为核心技术人员提供有竞争 力的激励机制和薪资待遇。 核心技术失密风险 采购成本上升风险 数据安全相关风险等 34请务必阅读正文之后的信息披露和免责申明 股票投资评级 自报告日后的 6个月内,相对同期沪深 300指数的涨跌幅 行业投资评级 自报告日后的 6个月内,相对同期沪深 300指数的涨跌幅 买入 预期股价相对收益 20%以上 增持 预期股价相对收益 10%-20% 持有 预期股价相对收益 -10%-10% 卖出 预期股价相对收益 -10%以下 强于大市 预期行业指数涨幅 5%以上 中性 预期行业指数涨幅 -5%-5% 弱于大市 预期行业指数涨幅 -5%以下 投资评级声明 类别 说明 评级 体系 分析师声明 本报告署名分析师在此声明:我们具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,本报告所表述的所有观点均准确地反映了我们对标的证 券和发行人的个人看法。我们所得报酬的任何部分不曾与,不与,也将不会与本报告中的具体投资建议或观点有直接或间接联系。 一般声明 除非另有规定,本报告中的所有材料版权均属天风证券股份有限公司(已获中国证监会许可的证券投资咨询业务资格)及其附属机构(以下统称“天风证券”)。未 经天风证券事先书面授权,不得以任何方式修改、发送或者复制本报告及其所包含的材料、内容。所有本报告中使用的商标、服务标识及标记均为天风证券的商标、 服务标识及标记。 本报告是机密的,仅供我们的客户使用,天风证券不因收件人收到本报告而视其为天风证券的客户。本报告中的信息均来源于我们认为可靠的已公开资料,但天风证 券对这些信息的准确性及完整性不作任何保证。本报告中的信息、意见等均仅供客户参考,不构成所述证券买卖的出价或征价邀请或要约。该等信息、意见并未考虑 到获取本报告人员的具体投资目的、财务状况以及特定需求,在任何时候均不构成对

注意事项

本文(海天瑞声:训练数据小巨人资源库领头羊.pdf)为本站会员(行业报告-1)主动上传,报告吧仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知报告吧(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2022 报告吧 版权所有
经营许可证编号:宁ICP备17002310号 | 增值电信业务经营许可证编号:宁B2-20200018  | 宁公网安备64010602000642号


收起
展开