2020年中国大数据服务行业概览.pdf
1 2020年 中国大数据服务行业概览 概览标签:数据采集、数据交易、数据安全 报告提供的任何内容(包括但不限于数据、文字、图表、图像等)均系 头豹研究院独有的高度机密性文件(在报告中另行标明出处者除外)。 未经头豹研究院事先书面许可,任何人不得以任何方式擅自复制、再造 、传播、出版、引用、改编、汇编本报告内容,若有违反上述约定的行 为发生,头豹研究院保留采取法律措施,追究相关人员责任的权利。头 豹研究院开展的所有商业活动均使用“头豹研究院”或“头豹”的商号、商标 ,头豹研究院无任何前述名称之外的其他分支机构,也未授权或聘用其 他任何第三方代表头豹研究院开展商业活动。 报告主要作者:王则烨 2020/042 2020 LeadLeo 大数据服务是大数据产业的细分市场,大数据服务依托大数据及人工智能技术对数据资源进行分析和管理的服务,其服务类型包 括大数据交易服务、大数据采集服务、大数据分析服务、大数据安全服务、大数据可视化服务等。中国大数据服务行业中收益排 名较高的行业为金融(包括银行、保险、证券与投资)、政府、互联网,三个领域收益规模占据中国大数据服务收益规模的50%以 上。未来伴随海量数据的爆炸式增长,机器学习、高级分析算法等技术与企业业务应用的融合,更多数据应用场景逐渐落地,大 数据服务产业收益在中国大数据产业的占比有望由2019年的30%,增长至2023年的32.2%,2024年中国大数据服务行业市场规模有 望达到85.7亿美元。 数据交易及数据应用需求的增长为行业带来发展机遇 2020年全球数据产生量将达到50.5ZB,较2019年同比增长近25%。IDC中国预测,2025年中国大数据产生量有望增长至48.6ZB,2018年 至2025年的年复合增长率将达到30.35%。数据产生量迎来爆发式发展,企业用户的数据采集、数据交易及数据应用需求增长。 大数据的行业应用持续深化,各产业新兴业态逐渐形成 大数据底层设施的日益成熟及技术的持续创新,加速大数据服务在工业、教育、医疗、通信等领域的广泛渗透。大数据服务的应用推动 多行业数字化、网络化、智能化进程提速,促进产业格局重构,驱动企业生产方式和管理模式的变革,伴随大数据与各行业经济融合的 持续加深,其服务需求逐渐由感知型应用向预测型、决策型应用发展。 大数据安全服务需求激增,数据安全发展有望提速 自2016年起,勒索软件在全球范围内呈现爆发式增长,据全球知名独立安全整体解决方案提供商趋势科技的安全报告显示,勒索软件家 族的数量从2015年的29个增长至2016年的247个,上涨幅度752%。瑞星“云安全”系统2018年上半年共截获勒索软件样本31.44万个,感染 共计456万次。勒索软件及不法黑客对企业数据资产造成极大威胁,数据安全服务需求持续增长。 企业推荐: 大数点、海云数据、华途股份 概览摘要3 2020 LeadLeo 名词解释 - 05 中国大数据服务行业市场综述 - 06 定义及分类 - 06 产业链分析 - 07 产业链上游分析 - 08 产业链中游分析 - 10 产业链下游分析 - 13 大数据服务行业市场规模 - 14 中国大数据服务行业驱动因素 - 15 全球范围内数据产生量增长迅猛 - 15 大数据技术升级助力行业潜力释放 - 16 中国大数据服务行业政策解析 - 17 中国大数据服务行业发展趋势分析 - 18 大数据安全服务需求激增 - 18 行业应用持续深化 - 20 中国大数据服务行业风险分析 - 21 中国大数据服务行业竞争格局 - 22 目录4 2020 LeadLeo 中国大数据服务行业投资企业推荐 - 23 大数点 - 23 海云数据 - 26 华途股份 - 28 方法论 - 30 法律声明 - 31 目录5 2020 LeadLeo 新旧动能转化:利用新技术、新产业、新业态、新模式转变传统以资源和政府为导向的经济发展模式。 大数据人才:从事大数据相关领域工作的人才,拥有算法设计、程序编写、数据分析等专业技能的核心人才,同时具备一定大数据专业技术应用 的复合型人才。 数字经济:以信息和知识的数字化为关键生产要素、以现代信息网络为重要载体、有效利用信息通信技术提升经济发展效率、优化经济结构的系 列经济活动。 结构化数据:又称行数据,结构化数据由明确定义的数据类型组成,由二维表结构实现逻辑表达。结构化数据严格遵循数据格式与长度规范,主 要通过关系型数据库进行存储和管理。 非结构化数据:数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据,非结构化数据包括所有格式的办 公文档、文本、图片、图像和音频/视频信息等等。 大数据:Big Data,无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。 机器学习:Machine Learning,专门研究计算机如何模拟或实现人类学习行为以获取新知识或技能的学科,使计算机重新组织已有的知识结构使 之不断改善自身的性能。 区块链:分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。 云计算:Cloud Computing,基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展虚拟化的资源。 数据交易服务平台:Data Transaction Service Platform,为数据交易提供各项服务的信息化平台。 源数据 :Source Data,未经过特定需求加工直接用于交易的数据。 数据圈:每年被创建、采集或复制的数据集合。 名词解释6 2020 LeadLeo 7 2020 LeadLeo 大数据服务是大数据产业的细分市场,大数据服务依托大数据及人工智能技术对数据资源进行分析和管理的服务,其服务类型包括大数据采集服务、 大数据交易服务、大数据分析服务、大数据可视化服务、大数据安全服务等。 (1)大数据采集是从传感器和其它待测设备等模拟和数字被测单元中自动采集非电量或者电量信号,送到上位机中进行分析和处理;(2)大数据交 易服务是以大数据交易平台为载体对大数据进行买卖的行为,大数据交易平台为消费者提供数据期货、数据融资、数据抵押等服务;(3)大数据分 析服务是在海量数据环境下以特定的科学方式对巨大、多样的数据进行快速处理,从而获取某种可用于决策的信息,形成相应的大数据分析结果; (4)数据可视化是借助于图形化手段,将大型数据以图形图像形式表示;(5)大数据安全服务是指对数据在收集、处理、存储、检索、传输、交 换、显示、扩散等过程中的保护,保障数据在各环节中依法授权使用,不被非法冒充、窃取、篡改、删除、抵赖,确保数据信息的机密性、真实性、 完整性与不可否认性。 中国大数据服务行业市场综述定义及分类 在政府、企业和各类行业组织的协力推动下,中国大数据产业生态不断完善,大数据 服务作为大数据产业的细分领域将持续受益 大数据服务类型 服务类型 细分业务 业务需求 市场需求 典型代表企业 数据挖掘 数据内容分析 数据分类 源数据采集 数据预处理 浪潮、明略科技等 数据期货 数据融资 数据抵押 增加数据交易流量 加快数据流转速度 聚合数据、东方国信等 大数据采集 大数据交易 海量数据处理 数据多维度处理 用于决策的信息 中科曙光、帆软等 大数据分析 智能化数据可视化 平台搭建 提供开源可视化库 个性化定制数据 帆软、新意互动等 大数据可视化 数据检索 数据交换 数据加密 确保数据信息机密性、 真实性、完整性与不 可否认性 深信服、网智天元等 大数据安全 来源:华西证券,头豹研究院编辑整理8 2020 LeadLeo 来源:东方证券,头豹研究院编辑整理 中国大数据服务行业市场综述产业链分析 中国大数据服务行业上游资源提供商为中游参与者提供数据源及数据存储硬件,中游 大数据服务商为下游各领域用户提供大数据产品及服务 产业数据 服务商 用户信息 行业数据 配套资源 供应商 存储服务 下游:行业客户 中游:大数据服务商 上游:资源供应商 数据采集及预处理 数据分析 数据可视化 数据安全 产品 服务 第三方数 据服务商 互联网 巨头 国家机关 行业协会 数据交易 医疗 教育 交通 金融 政府 互联网 能源 其他 制造 中国大数据服务行业上游资源供应商为包括数据资源服务商(产业数据服务商、第三方数据服务商、互联网巨头等)、配套资源供应商(存储服务器 等)等,配套资源采购成本占据上游整体采购成本的10%-20% 。中国大数据服务行业中游参与者按照不同业务类型可分为数据采集及预处理服务商、 数据分析服务商、及数据安全服务商等,中游大数据服务商为下游各领域企业用户及政府用户提供大数据产品及服务。 中国大数据服务行业产业链 金融、政府、互联网,三个行业收益占 据中国大数据服务行业整体收益的50%以 上 数 据 资 源 服 务 商 大数据资源行业利润率高达70%-80%,配套资 源采购成本占据上游整体采购成本的10%-209 2020 LeadLeo 来源:头豹研究院编辑整理 中国大数据服务行业市场综述产业链上游分析:数据资源 数据是大数据服务行业的核心竞争资源,行业利润率较高,第三方数据服务商数据统 计维度丰富且深入,产品利润较高 数据是大数据服务行业的核心竞争资源,行业利润率高达70%-80%,但大数据服务行业尚未建立数据资源共享机制,大数据资源分散,数据集中度较 低,中游大数据服务商的数据采集成本以每年50%的速度增长。 产业数据服务商:产业数据提供商为中游大数据服务商提供行业统计数据,如国家机关、行业协会等,但不同政府部门及行业协会数据量有限,各 产业数据统计维度及调查深度不同,但伴随数据开放政策的深入,产业数据提供商有望沉淀多领域、多维度的数据信息。 第三方数据服务商:第三方数据服务商为中游大数据服务商提供图像、视频、语音和文本等数据收集、数据清洗、数据标注等服务,如咨询、市场 调查企业等,典型代表企业为明略数据、新华数据等。数据服务供应商根据数据质量及清洗与标注情况收取相应费用,平均每条数据收费0.2-200元, 利润率高达100%。相较于产业数据提供商,咨询公司对不同垂直领域的数据调查更为详尽,数据调查分析维度多样且深入,部分咨询服务企业自建 数据库,中游大数据服务商可向其购买数据资源或调查报告。 互联网巨头:以BAT为代表的互联网巨头,其自身生态链积累较多电商、社交、搜索数据,具备向大数据服务商输出数据源的能力,通常互联网巨头 所产生的数据不对外开放,主要应用于企业内部的生态建设、企业决策及产品定制。 中国大数据服务数据源分类 服务商分类 主要参与者 优势 劣势 参与者代表 产业数据提供商 国家机关、行业协会 官方数据可信赖程度较高、行业 覆盖范围较广、部分数据免费 数据量有限,数据统计维度及深度不足 第三方数据服务商 咨询公司、市场调研公司 调查维度丰富、数据库资源 购买成本较高 互联网巨头 百度、阿里巴巴、腾讯 数据资源丰富 通常不对外开放,用于自身生态建设10 2020 LeadLeo 存储服务器提供商:存储服务器是中国大数据服务行业的核心硬件,用于存储海量数据。存储服务器可分为传统服务器和云存储服务器两种。 IBM、浪潮、华为等传统服务器供应商为中游大数据服务商销售服务器整机,以浪潮服务器整机产品为例,其售价为7,300-233,300元。购买传统服 务器的中游大数据服务商需自主搭建服务器运营平台,除服务器整机采购成本外,中游大数据服务商需支付较高的运营维护费用,企业前期投入成 本较高。 阿里云、腾讯云、亚马逊等云存储服务商为中游大数据服务商提供数据存储服务,数据云存储服务商将数据布局于云端,无需用户投入建设成本, 同时用户可在任何地点依靠单机或移动设备随时访问数据,降低开发运维难度和整体IT成本。但数据云存储的租用费伴随存储量提高而上升,有大 规模数据存储需求的大数据服务商需支付较高的运营费用。 中国大数据服务行业市场综述产业链上游分析:存储服务器 中国存储服务器是大数据资源重要的存储载体,中国存储服务器国产化程度高,代表 企业包括浪潮、阿里云等 来源:东方证券,头豹研究院编辑整理 2,070-2,295 7,300-29,050 18,500-233,300 34,500-68,000 105,100-158,200 51,600-195,600 塔式单路 机架式双路 存储服务器 高密度服务器 刀片服务器 单位:元/台 产品名称 4,140-4,590 16,560-18,360 9,288-10,296 18,576-20,592 单位:元/年 产品名称 通用型G6 通用型网络 增强型sn2ne 产品内存量 2核8G 4核16G 8核32G 4核32G 16核64G 服务器品牌 服务器品牌 浪潮 阿里云 中国存储服务器品牌11 2020 LeadLeo 来源:东方证券,头豹研究院编辑整理 中国大数据服务行业市场综述产业链中游分析(1/3) 数据采集和预处理是大数据分析和处理的重要环节,数据采集方式、数据内容的分类 及过滤对数据分析结果具有重要影响 数据采集和预处理服务商为下游数据需求方提供定时数据采集、 随机采集、终端主动上报数据等多种数据采集模式,支持手工 输入、电子表格自动导入等多种导入方式,且能够对所采集的 数据进行维护,包括添加、修改、删除等操作。 主流大数据采集平台架构图 数据存储和索引 数据采集及清洗 数据采集层 数据存储层 数据检索层 数据的搜索和处理 发送 数据 提供搜索时 的信息抽取 数据采集和预处理服务商:数据采集与预处理服务商为下游数据需求方提供数据原始数据信息采集及智能分析处理服务。典型的数据采集和预处理 服务商包括新智认知、智慧星光、浪潮、明略科技等。 数据采集环节 数据预处理环节 数据采集和预处理服务商对数据进行智能分析处理,利用内容 分析、自动分类等智能化处理技术,对采集到的数据信息进行 挖掘整合。 数据挖掘基本流程 数据采集 数据清洗 数据特征提取 数据结构化 数据存储 分析结果评价 数据分析 数据预处理12 2020 LeadLeo 来源:东方证券,头豹研究院编辑整理 中国大数据服务行业市场综述产业链中游分析(2/3) 近年来大数据应用逐渐普及,数据资源的价值逐步得到各领域的重视和认可,数据交 易需求持续攀升 数据交易服务商:数据交易服务商将分散在各行业领域不同主体内部的数据资源汇集到统 一的平台中,通过统一规范的标准体系为数据需求方(数据分析服务商和行业用户)提供 数据共享、对接和交换服务。数据交易平台是数据交易行为的重要载体,数据交易平台的 发展可促进数据资源整合、规范交易行为、降低交易成本及增强数据流通性。截至2019年 底中国首家大数据交易所贵阳大数据交易所已接入225家优质数据源,经过脱敏脱密, 可交易的数据总量超150PB,可交易数据产品4,000余个,2018年交易金额超过7,000万元, 2019年上半年交易额已突破1亿元。 个人用户 数据提供方 数据交易平台 数据需求方 应用 APP使用权 提供个人信息 提供个人信息 提供 个人 信息 信息 付费 提供数据及服务接口 提供数据及服务接口 分成收入、一次性销售收入 提供数据及 服务接口 数据销售收入 资源共享 数据销售收入、资源共享 目前,中国数据交易以政府为主导的数据交易为主, 占据数据交易平台总量的60%,企业为主导的大数据 交易平台多为企业独资或合资运营,占据企业大数据 平台的82%。目前数据交易业务涉及的行业主要为金 融征信、交通地理、移动通讯、企业管理及医疗数据 等,大数据交易资源分布较集中的领域与中国大数据 企业主要业务方向基本一致,其中金融征信及企业管 理数据交易增速较快。 中国大数据交易流程分析 5.8% 5.2% 6.1% 6.8% 9.9% 10.5% 11.5% 12.3% 14.1% 17.8% 0% 5% 10% 15% 20% 其他 人工智能 应用开发 生活服务 资源能化 医疗健康 企业管理 移动通讯 交通地理 金融征信 大数据交易资源行业分布概况,2019年 资金流 服务流13 2020 LeadLeo 来源:头豹研究院编辑整理 中国大数据服务行业市场综述产业链中游分析(3/3) 数据可视化服务商为用户提供直观、简单易用的数据可视化平台,助力企业及时掌握 经营数据;数据安全服务商的产品战略将由“被动抵御”走向“主动防护” 数据可视化服务商 数据可视化服务商为业务分析员及IT开发人员提供数据可视化产 品及系统:针对业务分析员,数据可视化服务商提供无编程、 简单易用的智能化数据可视化平台,助力用户快速搭建、展示大 屏实时数据,及时了解及分析经营数据;针对IT开发人员,百 度、阿里等企业通过提供开源可视化库,满足用户个性化定制数 据可视化图表的需求。 “大数据+AI”赋能的态势感知主动防护策略 可视 安全态势呈现 预警可能攻击 主动评估风险 快速调查事件 全面关联时间 修复/实施变更 安全设备联动 网络设备联动 业务系统联动 溯源 联动 大数据 + AI 数据安全服务商 在数据安全态势感知市场,安恒信息和奇安信等网络安全企业的产品优势显著, 处于中国态势感知市场的第一梯队。未来,伴随企业数据安全战略的转移,具 有先发优势的态势感知厂商有望凭借其不断积累的技术和经验提升自身的市场 份额和品牌影响力。 勒索软件攻击事件频发,企业对数据安全管控的重视程度逐渐加深,各应用场 景消费者防护思想的转变由“风险发现、查缺补漏”转向“关口转移、系统规划”, 基于动态综合防御体系进行规划,实现信息化和安全同步规划、同步建设和同 步运营,企业数据安全战略有望由“被动抵御”演变为“主动防护”。 企业名称 可视化平台产品 核心用户 帆软 finereport(报表软件)、finebi(商 业智能)、大屏可视化 业务分析员 IT开发人员 数字冰雹 大屏可视化、三维展现等 业务分析员 百度 Echarts(开源图表控件) IT开发人员 阿里 AntV(蚂蚁金服可视化控件)、 DataV(数据可视化大屏) 业务分析员 IT开发人员 网易 网易有数(数据分析平台) 业务分析员 部分企业的数据可视化产品14 2020 LeadLeo 来源:中国信通院,头豹研究院编辑整理 中国大数据服务行业市场综述产业链下游分析 中国大数据服务行业下游各领域基础设施成熟度及信息化程度是影响大数据应用的重要因素,据IDC中国数据显示,2019年中国大数据服务行业收 益排名前三的行业为金融(包括银行、保险、证券与投资)、政府、互联网,三个领域收益总和占据中国大数据服务行业整体收益的50%以上。金 融、政务行业于20世纪初开始信息化建设,基础信息化建设现已初步完成,互联网行业信息化程度高,可采集、处理和交易的数据量较大,因此相 较于医疗、工业等领域,金融、政务和互联网行业结构化数据占比高,数据标准化程度高,用户占比较高。 伴随企业信息化进程的加快,提升企业决策效率(53.6%)、提高企业运营效率(48.4%)规避企业管理风险(25.8%)成为下游企业用户向中游服务 商购买大数据产品及服务的主要因素,未来伴随大数据技术的发展,下游企业用户将逐渐加大其大数据领域的投入以加强企业运营效率,提升企业 竞争力。中国信通院数据显示,2018年近55%的企业用户计划增加其在大数据领域的投入,下游用户对大数据产品及服务需求的升高加速为中游大 数据服务商提供较大发展空间。 大数据技术的应用助力企业实现智能决策、提升运营效率及增强企业生产力,未来下 游企业用户将逐渐加大其大数据领域的投入以加强企业运营效率 排名 需求动因 占比 1 提升企业决策效率 53.6% 2 提高企业运营效率 48.4% 3 规避企业管理风险 25.8% 4 创造新的业务收入 25.6% 5 提升客户满意度 20.7% 6 增强企业生产力 21.1% 其他 4.2% 中国大数据服务行业下游企业用户需求动因分析 35.2% 32.7% 15.4% 12.5% 4.2% 投入增加50%以内 保持现状 投入增加50%-100%以上 投入减少 投入增加100%以上 中国大数据服务行业下游企业用户在大数据领域的投入,2018年15 2020 LeadLeo 来源:IDC中国,头豹研究院编辑整理 大数据行业利好政策及相关技术的发展驱动中国大数据市场保持平稳较快增长, IDC中国预测,2023年中国大数据行业收益规模将增长至226.5亿美元,大数据 市场的稳定发展将辐射其细分市场。中国大数据行业细分市场包括大数据硬件 市场、大数据软件市场和大数据服务市场,其中大数据服务市场占比约30%。 目前,中国大数据服务行业中收益较高的行业为金融(包括银行、保险、证券 与投资)、政府、互联网,三个领域收益总和占据中国大数据服务行业整体收 益的50%以上,未来伴随海量数据的爆炸式增长,机器学习、高级分析算法等 技术与企业业务应用的融合,更多的数据应用场景逐渐落地,2023年大数据服 务产业收益在中国大数据产业的占比有望增长至32.2%,2024年中国大数据服 务行业收益规模有望达到85.7亿美元。 中国大数据服务行业市场综述市场规模 19.3 20.3 23.8 27.2 31.5 38.9 47.7 60.5 70.8 85.7 0 20 40 60 80 100 2015 2016 2017 2018 2019 2020预测 2021预测 2022预测 2023预测 2024预测 亿美元 中国大数据服务行业市场规模 (按收益规模计) 年复合增长率 2015-2019年 13.0% 2019-2024年预测 22.2% 基于利好政策的持续颁布以及大数据技术的创新融合,推动中国的大数据产业快速发 展,未来伴随更多的数据应用场景逐渐落地,大数据服务市场有望持续扩容 中国大数据服务行业市场规模(按收益规模计),2015-2024年预测 79.0 97.5 116.7 147.8 187.7 226.5 0 50 100 150 200 250 2018 2019 2020预测 2021预测 2022预测 2023预测 亿美元 中国大数据行业市场规模(按收益规模计),2018-2023年预测 16 2020 LeadLeo 中国大数据服务行业驱动因素全球范围内数据产生量增长迅猛 2020年全球数据产生量将达到50.5ZB,2025年 中国大数据产生量有望增长至48.6ZB,数 据产生量迎来爆发式增长,企业用户的数据采集、数据交易及数据应用需求增长 伴随产业信息化及数字经济的发展,全球数据储量持续提高,同时5G、人工智能、云计算、区块链等新一代信息技术的发展推动大数据技术走向融 合发展阶段。据全球知名数据调查机构Statista数据统计及预测,2020年全球数据产生量将达到50.5ZB,从2018年全球大数据储量分布状况分析,中 国成为大数据存储量最高的国家,占据全球大数据储量的23%,美国大数据存储量位居全球第二,占比全球大数据储量的20.4%。 来源:Statista,IDC中国,华西证券,头豹研究院编辑整理 23.0% 20.4% 18.2% 31.0% 7.4% 中国 美国 APJxC地区 EMEA地区 其他地区 注:APJxC地区:包括日本但不包含中国的亚太区 EMEA地区:欧洲,中东及非洲三个地区的合称 全球大数据储量地区分布,2018年 中国大数据产生量及数据存储量居全球首位 伴随中国大数据、移动互联网、物联网等产业的深入发展,中国数据产生量迎来爆发式发展,数据采集、数据交易及数据应用需求的增长为中国大 数据服务行业带来发展机遇。IDC中国数据显示,2018年中国大数据产生量为7.6ZB,IDC中国预测,2025年中国大数据产生量有望增长至48.6ZB, 2018年至2025年的年复合增长率将达到30.35%,中国有望拥有全球最大的数据圈。 数据交易及数据应用需求的增长为中国大数据服务行业带来发展机遇 18 26 33 41 50.5 16.1% 44.4% 26.9% 24.2% 23.2% 0% 5% 10% 15% 20% 25% 30% 35% 40% 45% 50% 0 10 20 30 40 50 60 2016 2017 2018 2019 2020预测 全球数据产生量, 2016年至2020年 ZB17 2020 LeadLeo 中国大数据服务行业驱动因素大数据技术升级助力行业潜力释放 以数据分析、数据流通及事务处理技术为核心的大数据技术体系日渐完善,数据技术 和数据服务融合程度加深,助力企业用户需求潜力持续释放 全球数据量的增加及数据类型的变化打破原有数据结构,传统的关系型、结构化数据在数据总量中的比重逐渐缩小,视频和语音等大量非结构化数 据占据数据总量的比例逐渐增多,占比近80%。传统大数据技术难以应对数据量较大的非结构化数据,持续增长的数据处理需求推动大数据处理系统 和分析技术的快速发展,为大数据服务行业的潜力释放提供技术支持。 来源:CNVD,绿盟科技,头豹研究院编辑整理 非结构化数据量激增,推动大数据技术创新升级 大数据技术体系日渐完善 大数据技术体系主要由数据分析技术、 数据流通技术和事务处理技术构成: 数据分析技术融合传统数据库和MPP数 据库优点,逐渐向流处理加强、SQL支持、 深度学习支持等方向演进;数据流通 技术持续创新,衍生出同态加密、零知 识证明、差分隐私等多种数据流通工具, 在保证数据流通环节安全高效的基础上, 具有不缓存数据、保护个人隐私、保护 数据版权、可追溯数据来源等优势,可 有效提升大数据服务的安全性;事务 处理技术基于底层硬件和上层应用的不 断变化,逐渐由集中式数据库等单点架 构为主的传统事物技术模式转化为分布 式架构,分布式数据库技术的应用为大 数据服务商提供可弹性扩展、高响应速 度、易维护的数据库服务平台。 计算处理 查询与分析 数据存储与管理 数据采集 与传输 可视化 展现 群签名 同态加密 零知识证明 环签名 差分隐私 大数据 技术 数据分析 技术 数据流通 技术 事务处理 技术 分布式存储系统 NoSQL 数据库 内 部 数 据 结 构 数据中台助力企业数字化转型 数据技术和数据服务深度融合 新的平台技术 新的服务方案 创新力 场景驱动 资产沉淀 利用数据思维激活行业睡眠数 据,形成企业发展新动力 基于数据资产体系及服务体系, 快速响应市场需求 打通数据壁垒,深度挖掘企业 数据价值,助力企业决策 数据触点 数据采集 业务接入 其他 分析模型 用户运营 推广营销 其他 数 据 技 术 数 据 服 务 大数据技术体系及应用价值18 2019.12 LeadLeo 来源:工信部,中国政府网,头豹研究院编辑整理 基于大数据技术对经济社会转型发展的积极作用,中央及各级政府对大数据发展的重视程度得以显著提升。自2015年起,国家、各部委、各地政府 (含省、市、区县等)已形成多层次协同推进的大数据发展政策环境。2016-2019年间,国家、各部委及各地政府出台多项产业利好政策,如大数 据产业发展规划(2016-2020年)、关于运用大数据加强对市场主体服务和监管的若干意见和关于组织实施促进大数据发展重大工程的通知 等。大数据利好政策正逐渐向各细分应用领域延伸,强调大数据技术与具体应用场景的结合,重视大数据在产业转型和政府治理方面的应用,逐步 完善大数据产业从顶层设计到落地应用的多层次政策体系,持续优化大数据细分领域发展环境。 政策及标准名称 颁布日期 颁布主体 政策要点 数据安全管理办法(征求意见稿) 2019-05 国家互联网信息 办公室 维护国家安全、社会公共利益,保护公民、法人和其他组织在网络空间的合法权益,保 障个人信息和重要数据安全 信息安全技术大数据交易服务安全要求 2017-12 国家标准化管理 委员会 有助于理清数据交易安全界限,促进数据交易行为合法合规,推动中国数据交易机构的 安全建设,促进数据交易行为合法合规,促进全国数据要素有序流通,充分释放数据红 利,助力“数字中国”建设 大数据产业发展规划(2016-2020年) 2017-01 工信部 以大数据产业发展中的关键问题为出发点和落脚点,以强化大数据产业创新发展能力为 核心,推动促进数据开放与共享、加强技术产品研发、深化应用创新,打造数据、技术、 应用与安全协同发展的自主产业生态体系 关于组织实施促进大数据发展重大工程 的通知 2016-01 国家发改委 政府将重点支持大数据示范应用、共享开放、基础设施统筹发展,以及数据要素流通。 国家发改委将择优推荐项目进入国家重大建设项目库审核区,并根据资金总体情况予以 支持 关于运用大数据加强对市场主体服务和 监管的若干意见 2015-06 国务院办公厅 充分认识运用大数据加强对市场主体服务和监管的重要性,提高大数据运用能力,增强 政府服务和监管的有效性,运用大数据加强和改进市场监管 中国大数据服务行业政策解析 中国大数据行业相关政策 伴随数字经济建设速度的加快,政府对大数据行业发展重视程度逐渐提升,大数据产 业多层次政策体系逐渐完善,大数据服务等细分产业持续受益19 2020 LeadLeo 分类 事件名称 事件时间 泄露人员 泄露数据规模 非法所得金额(元) 海外地区数据泄露事件 Facebook数据泄露事件 2018-03 共享第三方 剑桥分析公司等 5千万条 - 美国国家安全局泄露绝密数据 2017-10 美国国家安全局内部人员 100GB以上 - 德勤数据泄漏 2017-10 黑客,非法获取管理员账号进行犯罪 500万条 - 中国各领域数 据泄露事件 政府部门 南京公务员泄露居民信息 2018-01 内部人员,副主任科员刘某 82 万条 - 国家宏观经济数据泄露 2010-2011 原国家统计局干部孙振等 多次泄露 - 教育 教育考试信息泄露 2016-08 黑客入侵 - 5万 医疗 疾控中心信息泄露 2016-07 黑客入侵 30 个省的 275 例 - 上海新生儿信息外泄 2016-07 原上海疾控中心工作人员韩某等 20 万新生儿信息 - 社保 篡改退休人员数据非法牟利 2010-2011 某市社保局退管中心蔡某等 - 280 万 非法获得养老金 2005-2008 某区社保事业管理处副主任王某等 - 190.5 万 其他 博士黑客贩卖公民信息 2018-04 某国有大型科技公司数据库员工 500余万条 60G容量 - 近年来,数据泄露事件频发,且涉及领域广泛,社会及企业承受巨大经济损失。数据泄露原因包括黑客的恶意攻击、内部工作人员的信息贩卖、第 三方外包人员的交易行为、数据共享第三方的数据泄露、开发测试人员的违规等,数据泄漏途径呈现多元化。社会各界对数据资产安全的关注度与 日俱增,减轻数据泄露为社会发展带来的影响,加强数据防护、抵御不法黑客恶意入侵成为推动数据安全服务需求增长的主要动力。 来源:中国信通院,头豹研究院编辑整理 全球部分数据泄露事件概要 中国大数据服务行业发展趋势分析数据安全服务将持续增长(1/2) 数据的多路径泄露为社会发展带来严重影响,加强数据防护、抵御不法黑客恶意入侵 有望成为大数据服务需求方的主要需求20 2020 LeadLeo 中国大数据服务行业发展趋势分析数据安全服务将持续增长(2/2) 近年来,政府与企业的信息化程度不断加深,IT系统的复杂程度及开放程 度随之提升,其安全问题将严重影响企业发展和社会决策。自2016年起, 勒索软件在全球范围内呈现爆发式增长,据全球知名独立安全整体解决 方案提供商趋势科技的安全报告显示,勒索软件家族的数量从2015年的 29个增长至2016年的247个,上涨幅度752%。美国联邦调查局2017年1月 调查数据显示,勒索软件的赎金总额由2015年的2,400万美元跃升至2016 年的10亿美元。瑞星”云安全“系统在全球范围内共截获恶意网址总量 4,785万个,其中挂马网站2,900万个,诈骗网站1,885万个。美国恶意网 址总量为1,643万个,位列全球第一,其次是中国226万个。 来源:美国联邦调查局,趋势科技,国家保密科技测评中心,瑞星官网, 360互联网安全中心,头豹研究院编辑整理 勒索软件的威胁日趋严重,中国成为亚太地区受影响最严重的国家之一。 国家互联网应急中心2017年捕获新增勒索软件近4万个,360互联网安全 中心发现2017年5月至2018年4月全国约有463.5万台电脑遭到勒索攻击, 且勒索软件的质量和数量持续攀升。瑞星“云安全”系统2018年上半年共 截获勒索软件样本31.44万个,感染共计456万次,其中广东省感染116万 次,位列全国第一,其次为上海市62万次。数据安全服务需求持续升高, 有望成为大数据服务行业发展较快的细分市场。 中国勒索软件感染地域分布(前十名省市),2018H1 广东,116万次 上海,62 辽宁,14 北京,34 山东,18 江苏,22 四川,22 甘肃,11 安徽, 11 浙江,17 0 200 单位:万次 1,643 226 72 71 58 58 0 200 400 600 800 1,000 1,200 1,400 1,600 1,800 美国 中国 德国 荷兰 俄罗斯 法国 万个 2018年上半年部分国家恶意网站地域分布 勒索软件及不法黑客对企业及社会的数据资产造成极大威胁,数据安全服务需求持续 增长,有望成为大数据服务行业发展较快的细分市场21 2020 LeadLeo 中国大数据服务行业发展趋势分析行业应用持续深化 伴随大数据底层设施逐渐成熟,技术融合程度持续加深,加速大数据服务应用场景的 拓展及深化,行业应用逐渐向各领域的核心业务延伸 大数据底层设施的日益成熟及技术的持续创新,加速大数据服务在工业、教育、医疗、通信等领域的广泛渗透。大数据服务的应用推动多行业数字 化、网络化、智能化进程提速,促进产业格局重构,驱动企业生产方式和管理模式的变革,伴随大数据与各行业经济融合的持续加深,其服务需求 逐渐由感知型应用向预测型、决策型应用发展。 来源:IDC中国,华西证券,头豹研究院编辑整理 各领域大数据未来服务新需求 大数据的行业应用不断深化,各产业新兴业态逐渐形成 通信 汽车 医疗 新零售 政府 电子商务 金融 物流 电子病历 临床辅助决策支持 智能医疗平台化深化发展 数据整合后的全智能诊疗 客户体验分析 客户价值分析 营销运营、管理应用 客户体验管理 产业链营销重构 消费者数据描述 供应链数据优化 新商业模式开拓 政府业务智能决策 公共服务数据辅助 政府数据治理 提高智慧城市感知水平 大数据风控建立客户信用 评分 数据整合效率提升,数据 价值挖掘 客户行为分析 无人驾驶 车载信息服务数据 精准数据分析 “车+人”的数据模式 市场营销 个性化导购 数据化运营 数据资产化 提升物流智能化水平 降低物流成本 提高用户服务水平 库存预测、设备修理预期 目前,制造企业对大数据服务的需求集中在加速优化产业链,提升管理能力,实现产品敏捷规划,推进制造业智能化发展等环节。伴随大数据技术 的创新升级,制造企业对大数据服务的需求将有所提升,例如,对企业生产线的能耗状况进行精准判断分析从而调控生产战略,有效实现生产过程 的节能降耗,优化产品设计,实现企业绿色化转型。 大数据推动制造业转型升级提速 大数据助力防疫布控,建立医疗领域新业态 新冠肺炎疫情期间,大数据在医疗领域的作用逐渐凸显,如疫情动态信息公布、发展趋势研判预测、涉疫人员的精准定位及防控工作的指挥调度均 依赖大数据的支撑。大数据的应用为疫情防控提供强大的数据支持和技术保障。疫情过后,大数据服务在医疗领域的应用有望不断向纵深拓展22 2020 LeadLeo 中国大数据服务行业风险分析人才短缺、数据利用率低风险 大数据核心人才供需矛盾问题突出,行业面临人才短缺风险;由于数据共享体系及数 据整合标准化系统缺失,大数据利用率低下 截至2018年12月,中国(不含港、澳、台地区)大数据核心人才缺口达60 万人,且存在地域和行业人才分布不均问题。猎聘网数据显示中国互联网、 电子通信和金