2021大数据白皮书-59页_1mb.pdf
大数据 白皮书 中国信息通信研究院 2021年 12月 No.202121 前 言 当前,全球已进入数字经济时代,我国高度重视数字经济发展。今年初通过的中华人民共和国国民经济和社会发展第十四个五年规划和 2035 年远景目标纲要 (以下简称 十四五规划)对于大数据的发展作出了重要部署。历经多年发展, 大数据从一个新兴的技术产业,正在成为融入经济社会发展各领域的要素、资源、动力、观念。 特别是我国提出 加快培育数据要素市场 后,大数据的发展迎来了全新的阶段。 可以看到, 2021 年以来,全球各国大数据战略持续推进,聚焦数据价值释放,而国内围绕数据要素的各个方面正在加速布局和创新发展。 政策方面,我国大数据战略进一步深化,激活数据要素潜能、加快数据要素市场化建设 成为核心议题; 法律方面,从基本法律、行业行政法规到地方立法,我国数据法律体系架构初步搭建完成; 技术方面,大数据技术体系以提升效率、赋能业务、加强安全、促进流通为目标加速 向各领域扩散,已形成支撑数据要素发展的整套工具体系; 管理方面 ,数据资产管理实践加速落地,并正在从提升数据资产质量向数据资产价值运营加速升级;流通方面 ,数据流通的基 础制度与市场规则仍在起步探索阶段,但各界力量正在从新模式、新技术、新规则等多角度加速探索变革思路;安全方面,随着监管力度和企业意识的强化,数据安全治理初见成效,数据安全的体系化建设逐步提升。 本白皮书是中国信通院 自 2014 年 以来第六次发布的大数据白皮书。基于多年研究和分析,本白皮书将以数据要素的价值释放作为核心逻辑,重点探讨大数据政策、 法律、 技术、管理 、流通、安全等方面的内容,并对 十四五 期间我国大数据的发展进行展望。 目 录 一、 全球大数据战略布局持续深化 . 1 (一)国外大数据战略稳步推进 . 1 (二)我国大数据战略深入落实 . 5 二、 大数据法律体系建设不断完善 . 9 (一)基础法律:搭建数据合规基本框架 . 10 (二)部委发力:细化落实基础合规要求 . 12 (三)地方立法:着力创新攻坚合规难题 . 16 三、 大数据技术体系发展创新变革 . 18 (一)效率提升:利用云原生思想进行能力升级 . 19 (二)赋能业务:利用开发平台释放业务潜能 . 21 (三)加强安全:利用 “零 信任 ”补足内生安全 . 22 (四)促进流通:利用隐私计算保障数据流通 . 24 四、 数据资产管理实践加速落地 . 25 (一)政策驱动数据资产管理持续发展 . 26 (二)企业数据管理能力建设逐步推进 . 28 (三) DataOps 加速数据资产 管理升级 . 29 (四)价值运营引领数据资产管理新模式 . 32 五、 数据流通面向多角度稳步探索 . 34 (一)各方积极探索数据流通模式变革与创新 . 34 (二)新兴技术方案变革数据流通的传统形态 . 39 (三)数据流通权责划分方式与规则持续探索 . 40 六、 数据安全体系化建设 逐步提升 . 42 (一)国内数据安全监管落地加快 . 42 (二)企业数据安全治理初见成效 . 43 (三)数据安全闭环体系加速建设 . 46 七、 大数据发展展望 . 48 参考文献 . 51 图 目 录 图 1 我国数据战略的布局历程 . 5 图 2 数据平台技术演变 . 19 图 3 数据开发平台对数据开发工作的影响 . 22 图 4 企业数据安全技术体系图 . 23 图 5 隐私计算技术体系 . 24 图 6 国内隐私计算产品发展情况 . 25 图 7 DCMM 各参评单位能力等级占比 . 29 图 8 DataOps 理念图 . 30 图 9 企业数据安全治理组织统计 . 44 图 10 企业数据分类分级情况统 计 . 45 图 11 企业数据安全风险评估情况统计 . 46 图 12 企业数据安全治理闭环体系 . 47 表 目 录 表 1 国家数据立法列表(部分) . 16 表 2 地方数据立法列表(部分) . 18 表 3 近一年发布的云原生大数据 技术产品一览 . 20 表 4 国内已有数据交易机构基本情况 . 35 大数据白皮书 1 一、 全球大数据战略布局持续深化 当前,数据正在成为重组全球要素资源、重塑全球经济结构、改变全球竞争格局的关键力量 。美英与欧盟稳步推进各自的数据战略,聚焦数据价值释放。 2021 年是我国 十四五 开局之年 , 这一年,国家 十四五 规划明确提出要激活数据要素潜能,并将大数据视为已融入经济社会发展各领域的重要应用,在多个篇章重点着墨,为 未来五年的 大数据发展谋划了总基调,对加快培育数据要素市场、保障大数据产业健康发展奠定了坚实基础。 (一) 国外大数据战略稳步推进 在全球经济衰退、新冠肺炎疫情爆发 的影响下,世界经济运行的不稳定性与不确定性因素持续增加,相比商品和资本全球流动受阻,数字化驱动的新一轮全球化仍保持高速增长,推动以数据为基础的战略转型成为各个国家和地区抢占全球竞争制高点的重要战略选择。 2021 年, 各国继续深化数据领域实践,探索发展 方向 , 推动经济的复苏与繁荣。 1.美国: 强化机构协同 ,深挖数据资源价值 美国作为数据强国, 率先施行开放政府数据 行动,旨在通过开放公共领域数据增强政府与公众间的互动,激发数据经济在社会经济增长中的引擎作用。 2019 年 12 月,美国发布国家级战略规划联邦数据战略与 2020 年行动计划, 战略中 明确 提出 将数据大数据白皮书 2 作为战略资源, 并以 2020 年为起点,勾勒联邦政府未来十年的数据愿景。 2021 年 10 月,美国管理和预算办公室( OMB)发布 2021 年的行动计划,鼓励各机构继续实行联邦数据战略。在吸收了 2020 年行动计划经验的基础上, 2021 年行动计划进一步强化了在 数据治理、规划和基础设施方面的活动。计划具体包括 40 项行动方案 ,主要分为三个 方向:一是构建重视数据和促进公众使用数据的文化;二是强化数据的治理、管理和保护;三是促进高效恰当 地使用数据资源。可以看出,美国在数据领域的政策越来越强调发挥机构间的协同作用,促进数据的跨部门流通与再利用,充分发掘数据资产价值,从而巩固美国数据领域的优势地位 。 2.英国: 细化国家数据战略 , 强调数据应用 英国政府 为促进数据在政府、社会和企业间的流动, 于 2020年 9 月发布国家数据战略 。 战略中 明确指出了政府需优先执行的五项任务以促进英国社会各界对数据的应用 :一是充分 释放数据价值; 二是加强对 可信数据体系的保护 ;三是改善政府 的 数据 应用现状,提高公共服务效率; 四是确保数据所依赖的基础架构的安全性和韧性;五是推动数据的 国际流动。 五项任务发布以来,英国政府采取了一系列行动促进数据的高效合规应用,如颁布政府数据质量框架,助力公共部门提升数据管理效率以及建立数据市场部门等。 大数据白皮书 3 2021 年 5 月 ,英国政府 在官方渠道 上发布政府对于国家数据战略咨询的回应 ,强调 2021 年的工作重心是深入执行国家数据战略,并表明将通过建立更细化的行动方案,全力确保战略的有效实施,由此可以看出英国政府利用数据资源激发经济新活力的决心。 3.欧盟:稳步执行欧盟数据战略,打造单一数据市场 2020 年 2 月 19 日欧盟委员会推出欧盟数据战略 ,该战略勾画出欧盟未来十年的数据战略行动纲要。区别于一般实体国家,欧盟作为一个经济政治共同体 ,其数据战略更加注重加强成员国之间的数据共享,平衡数据的流通与使用,以打造欧洲共同数据空间、构建单一数据市场。 为保障战略目标的顺利实现,欧盟实施了一系列重要举措 。欧盟数据治理法案作为欧盟数据战略系列举措中的第一项,于2021 年 10 月获得成员国表决通过 , 该 法案 旨在 为欧洲共同数据空间的管理提出立法框架 ,其中主要对三个数据共享制度进行构架,分别为公共部门的数据再利用 制度 、数据中介及通知制度和数据利他主义制度,以此确保在符合欧洲公共利益和数据提供者合法权益的条件下,实现 数据 更广泛的国际共享。 为保证战略的可持续性以及加强公民和企业对政策的支持和信任,2021 年 9 月 15 日,欧委会提交通向数字十年之路提案,大数据白皮书 4 该提案以 2030 年数字指南针 1为基础 ,为欧盟数字化目标的落地提供具体治理框架,具体包括:建立监测系 统以衡量各成员国目标进展;评估数字化发展年度报告 并 提供行动建议;各成员国提交跨年度的数字十年战略路线图等。 4.国际组织 : 重视互联互通,构建和谐的国际数据生态 在数字化转型的 时代 背景下,各国际组织十分重视数据在全球化发展中的作用 。 在 2021 年 8 月召开的 G20 数字经济部长会议 以及 9 月召开的联合国大会 中, 数据治理和数据流 通成为重点议题之一, 各国强烈呼吁国际社会加强数据互联互通,弥合数据流通分歧。 国际组织在弥合数据治理理念分歧方面发挥了积极作用。 当前,数据治理正在成为网络空间治理领域博弈的核心话题,美欧之间的观念分歧凸显。一方面,美国积极推动跨境数据自由,力图建立以美国为中心的国际数字生态系统 。 美国战略与国际问题研究中心(CSIS )于 2021 年 4 月发布亚太地区的数据治理报告并建议拜登政府发挥世界最大经济体的主导地位,形成具有全球共识的数据治理布雷顿森林体系。 另一方面,欧盟方倾向在保持高度隐私、安全和道德标准的前提下,推动单一数据市场的构建 。 自 2016年颁布通用数据保护条例( GDPR)到如今发布一揽子数据战 1 2021 年 3 月,欧盟公布 2030 年数字化指南针,进一步强化欧盟数字化转型赋权于民 、 繁荣经济的愿景,指出未来十年欧盟数字化转型工作将围绕数字技能培训、数字基础设施建设、企业数字化转型以及公共服务数字化四个维度开展。 大数据白皮书 5 略,欧盟始终将促进成员国内部的数据自由流动放在首位。 2021 年10 月,七国集团( G7)贸易部长会议就管理跨境数据使用和数字贸易原则达成一致,提出将在美欧制度之间找到中间立场,美欧之间在数字治理领域的冲突有望得到一定程度的缓解。 (二) 我国 大数 据 战略深入落实 自 2014 年大数据首次写入政府工作报告起,我国不断出台大数据相关政策。政策出台的思路也反映了各阶段大数据发展的特征以及面临的关键问题。 1.我国大数据战略布局不断演进 来源:中国 信息 通 信研究 院 图 1 我国数据战略的布局历程 酝酿阶段 (2 014 年 2015 年):从 2014 年 3 月大数据 首次写入政府工作报告 开始, 认识数据并重视数据价值成为这一阶段中央的重要着力点。 2015 年 8 月印发的促进大数据发展行动纲要(国发“2015” 50 号)明确提出数据已成为国家基础性战略资源,大数据白皮书 6 并对大数据整体发展进行了顶层设计和统筹布局,产业发展开始起步。 落地阶段 (2 016 年 2019 年):2016 年 3 月, 十三五 规划纲要正式提出实施国家大数据战略 , 这一时期,政策制定者看到了数据对于推动我国经济发展的重要作用 ,大数据与包括实体经济在内的各行各业的融合成为了政策热点。 2017 年 10 月,党的十九大报告中提出推动大数据与实体经济深度融合; 12 月,中央政治局就实施国家大数据战略进行了集体学习,国内大数据产业开始全面、快速发展。 深化阶段 (2 020 年至今): 随着国内相关产业体系日渐完善,各类行业融合应用逐步深入,国家大数据战略开始走向深化。 2020年 4 月 9 日,中共中央、国务院发布关于构建更加完善的要素市场化配臵体制机制的意见,将 数据 与土地、劳动力、资本、技术并称为五种要素,提出 加快培育数据要素市场 。 5 月 18 日,中央在关于新时代加快完善社会主义市场经济体制的意见中提出进一步 加快培育发展数据要素市场 。 这意味着,数据已经不仅是一种产业或应用,而 已成为经济发展赖以依托的基础性、战略性资源。 数据要素市场化配臵上升为国家战略, 将对发展数字经济、完善现代化治理体系产生深远影响。在数字社会,数据 扮演 基础性战略资源和关键性生产要素双重 角色,一方面,有价值的数据资源是大数据白皮书 7 生产力的重要组成部分,是催生和推动众多数字经济新产业、新业态、新模式发展的基础;另一方面,数据区别于以往生产要素的突出特点是对其他要素资源 具有 乘数作用,可以放大劳动力、资本等要素在社会各行业价值链流转中产生的价值。作为生产要素之一,数据的流通、交易、资产化、资本化等各种配臵手段获得了前所未有的关注。 2.“ 十四五 ”规划全面布局大数据发展 2021 年 3 月, 中华人民共和国国民经济和社会发展第十四个五年规划和 2035 年远景目标纲要 (以下简称 十四五 规划 )正式发布。 大数据 一词在规划稿中出现了 十四 次,而 数据 一词则出现了六十余次。相对于五年前 十三五 规划中专门用一章 实施国家大数据战略 集中描述大数据发展, 十四五 规划中对于大数据发展的着墨已经融入到了各篇章之中。这在一定程度上表明,大数据已经不仅是一个新兴的技术产业,而是正在成为融入经济社会发展各领域的 新理念 、新 资源和新动力。 十四五 规划对于大数据发展的布局,可以概括为 突出 数据在数字经济中的关键作用 、 加强数据 要素市场 规则建设 、重视 大数据相关基础设施建设 。 将大数据作为数字经济的重要 “原料” ,加强供给能力。 十四五 规划 第十五章 打造数字经济新优势 从数据技术和产业的角度出发,逐步递进,紧扣数字经济发展主线。技术层面,提出加强大数据白皮书 8 关键数字技术的创新应用,加强大数据技术的外延供给,强调关键技术和前沿技术,并对开源社区 的构建提 出要求;产业层面, 提 出加快推动数字产业化是大数据发展的核心,培育壮大包括大数据在内的新兴数字产业,鼓励企业开放搜索、电商、社交等数据,发展第三方大数据服务产业, 并且 直指当前大数据发展面临的突出障碍,对促进共享经济、平台经济健康发展等提出要求。 针对数据要素市场目前面临的 问题,提出加强规则。 十四五规划第十八章 营造良好数字生态 关注数据要素市场规则和政策环境,提 出放管并重,发展与规范管理相统一 的总原则。该章从统筹数据开发利用、隐私保护和公共安全 、 建立健全数据产权交易和行业自律机制 、 加强涉及国家利益、商业秘密、个人隐私的数据保护 、 完善适用于大数据环境下的数据分类分级保护制度 、 加强数据安全评估 五个层面出发,涉及数据资源产权、交易流通、跨境传输和安全保护等 多方面 , 提到了立法、制度、标准、自律、分类分级、评估等具体措施 ; 同时对构建与数字经济发展相适应的政策法规体系进行论述, 对加强大数据安全保障和国际合作提出明确要求。 完善数据资源汇聚与流动的关键支撑底座 ,建设新型基础设施。十四五 规划 第十一章 建设现代化基础设施体系 重点 关注了与大数据产业息息相关的新型基础设施建设。作为信息基础设施上承载的主要资源,数据是新型基础设施的 血液 。网络、物联网、大数据白皮书 9 数据中心是大数据发展的重要基础设施,超算中心、工业互联网、车联网的发展建设也离不开对于数据的分析和处理。 规划中提到的加快构建全国一体化大数据中心体系 对于深化政企协同、行业协同、区域协同,全面支撑各行业数字化升级和产业数字化转型具有重要意义。 十四五 规划为今后五年大数据的发展作出了总体部署,为各部门各地方进行大数据专项规划提供了重要依据。 2021 年 11 月底, 工信部印发“十四五”大数据产业发展规划 ,在响应国家 十四五规划 的基础上,围绕价值引领、基础先行、系统推进、融合创新、安全发展、开放合作 6 大基本 原则,针对十四五期间大数据产业的发展制定了 5 个发展目标, 6 大主要任务, 6 项具体行动以及 6 个方面的保障措施,同时指出在当前我国迈入数字经济的关键时期,大数据产业将步入集成创新、快速发展、深度应用、结构优化的高质量发展新阶段 。 二、 大数据法律法规体系建设不断完善 法律制度是数据要素市场化建设的重要保障。 2021 年我国数据立法取得突飞猛进的进展,备受关注的数据安全法 和个人信息保护法先后出台,与网络安全法共同形成了数据合规领域的 三 驾马车 ,标志着数据合规的法律架构已初步搭建完成。在此基础上,重点行业、新兴技术的法律和司法解释在今年密集出台,地方性立法成果丰硕,为国家安全提供了有力的支撑,为产业、技大数据白皮书 10 术的发展 提供了清晰的合规指引,也为人民提 供了更全面的权益保障。 (一) 基础法律:搭建数据合规基本框架 数据安全法与个人信息保护法的出台直面数字经济时代产业和社会发展的迫切需求,为数据要素市场化发展、数据安全保障和个人权益保护奠定了坚实的法律基础。 1.数据安全法:安全基础上求发展 数据安全法于 2021 年 6 月 10 日,由第十三届全国人民代表大会常务委员会第二十九次会议通过。 全文共七章五十五条,围绕保障数据安全和促进数据开发利用两大核心,从数据安全与发展、数据安全制度、数据安全保护义务、政务数据安全与开放的角度进行了详细的规制。 在保障数据安全方面, 数据安全法建立了数据分类分级、数据安全风险评估、安全事件报告制度、监测预警机制、应急处臵机制和安全审查等数据安全基本制度。在此基础上,首先明确了数据处理者应建立数据安全管理制度、进行安全教育培训、开展风险监测和报告、采用技术手段落实制度等法律义务。第二,要求国家机关履行保密义务、建立健全管理制度、审慎监督受托方等以应对政务数据开放带来的安全风险。第三,建立数据安全审查制度、数据出口管制制度、对等反制制度以维护国家的主权、安全和发展利益。 大数据白皮书 11 在促进发展方面, 数据安全法充分认可行业协会 、评估认证机构和标准化机构在推动技术发展、完善合规建设和促进行业自律方面的作用。在政务数据开放方面,明确了政务数据以公开为原则、不公开为例外的基本理念 。 数据安全法将为各行业带来深远的影响 。对大数据产业而言, 数据安全法搭建了数据安全合规制度的基本体系,为数据的处理者设臵了明确的数据安全保护义务。数据处理活动将会更加有法可依、有章可循,大数据产业也将开始告别野蛮生长,在日趋完善的安全法规体系框架内有序发展。 2.个人信息保护法:数据处理与权益保障并重 虽然近年来我国个人信息保护力度不断加大,但随意收集 、过度使用、非法买卖个人信息等问题仍十分突出 , 在此背景下, 个人信息保护法立足于数据产业发展和个人信息保护的迫切需求,聚焦于个人信息的利用和保护,进一步完善了我国数据合规领域的法律体系。 个人信息保护法于 2021 年 8 月 20 日,由第十三届全国人民代表大会常务委员会第三十次会议通过。该法建立了一整套个人信息合法处理的规则,一是确立了自然人的个人信息受法律包含的原则和个人信息的处理规则;二是根据个人信息处理的不同环节、不同种类,对个人信息的共同处理、委托处理、数据共享、数据公开、自动化决策等提出针对性的要 求;三是设专节对处理敏感个人大数据白皮书 12 信息作出更严格的限制,要求只有当具备特定的目的、充分的必要性时才可进行处理;四是设专节规定国家机关处理个人信息的规则,在保障国家机关依法履行职责的同时,要求国家机关处理个人信息应当依照法律、行政法规规定的权限和程序进行。 在个人权利和处理者义务的维度, 个人信息保护法一方面明确个人享有知情权、决定权、查询权、更正权、删除权等权利,另一方面要求处理者制定管理制度和操作规程,采取安全技术措施,指定负责人对个人信息处理活动进行监督,定期开展合规审计,对高风险处理活动进行事前风险评估, 履行个人信息泄露通知和补救义务等。 在个人信息跨境规则方面, 个人信息保护法设臵了网信部门安全评估和专业机构认证等前臵程序,对跨境的 告知 同意 提出更严格 的要求,要求获批后才可向境外司法或执法机构提供个人信息,规定在我国公民个人信息权益被境外侵害和在个人信息保护方面对我国采取不合理措施时 宜采取的相应 对策 等。 (二) 部委发力:细化落实 基础合规要求 在数据合规基础法律框架搭建完成后,针对工业、电信、金融、汽车等行业数据的基础性规范和指导性文件密集出台,关键信息基础设施建设、数据跨境和数据垄断等热点问题得到及时回应 ,着眼于人脸识别、算法等数据应用的规制也迅速跟进,为保护公民个人信息、保障国家安全的诸多难点热点问题提供了有力的法律保障。 大数据白皮书 13 1.行业数据基础 规范逐渐细化 在行业数字化转型的浪潮中,各行业沉淀了海量数据,关乎国计民生,因此对数据合规的需求更加刚性、更为紧迫。密切关注行业监管动态,落实行业数据合规要求已成为企业合规必然的发展趋势。 在工业和 通信 业, 工信部 2021 年 9 月 30 日发布了 工业和信息化领域数据安全管理办法(试行)(征求意见稿) 。 该 管理办法明确了各级主管机构的监管职责和引导产业发展的责任,详细规制了工业、电信数据的分类分级方法,重要数据、核心数据的判定条件和全生命周期备案管理制度。在应对安全风险方面,规范了数据安全监测预警与应急管理、数据安全检测评估与认证管理等制度。其中,在汽车行业, 随着数字化、智能化等技术在汽车制造领域的快速普及,整车和零部件的电子化和智能化水平快速提高,数字化技术在汽车行业的应用已日渐深入,汽车数据合规的重要性也由此日益凸显。 2021 年 7 月,网信办会同四部委发布了汽车数据安全管理若干规定(试行 ),专门针对网联汽车的场景对个人信息、敏感个人信息、重要数据等提出了数据分类 等要求。同期,工信部 印发了关于加强智能网联汽车生产企业及产品准入管理的意见,要求加强汽车数据安全、网络安全、软件升级、功能安全和预期功能安全管理,保证产品质量和生产的一致性,推动智能网联汽车产业高质量发展。 大数据白皮书 14 在金融行业, 为整治个人征信行业的乱象,央行 于 2021 年 9月 30 日发布征信业务管理办法以保护信息主体 的 合法权益,促进征信业的健康发展。 该 办法清晰定义了征信业务和信用信息,并在附则中特别厘清了实践中多种业务形态的实质;要求个人征信机构必须持牌经营,金融机构只能与取得相应资质的市场机构开展合作;对征信机构在信用信息的采集、整理、保存、加工、提供和使用的全流程进行了详细规制。 2.数据产业热点问题得到回应 为进一步保障关键信息基础设施安全,落实网络安全法和数据安全法的要求, 网信办于 2021 年 7 月正式发布关键信息基础设施安全保护条例 , 明确 了关键信息基础设施认定的具体部门和考虑因素,对运营者的安全责任义务进行 了 详细规范。 为规范数据出境活动,保护个人权益、国家安全并促进数据的跨境安全和自由流动,网信办于 2021 年 10 月 29 日发布数据 出境安全评估办法(征求意见稿)。征求意见稿对数据出境安全评估程序作出了较为详细的规定,如强制申报安全评估的情形、申报材料、安全评估重点事项、评估程序、评估结果的时效以及结果失效的情形等,为我国数据跨境流通提供了重要的配套落地规则。此外,网信办于 2021 年 11 月 14 日发布网络数据安全管理条例(征求意见稿),要求赴国外和赴港上市企业、在境外设立总部、运营中心或研发中心的企业应申报网络安全审查,开展数据安全评估并报送大数据白皮书 15 评估结果,同时,管理条例也对年度数据安全评估报告的内容进行了详细规范。 针对数字化 卡特尔这一更为隐蔽的新型垄断协议形式,反垄断法(修正草案)明确将针对具有市场支配地位的经营者在利用数据和算法、技术以及平台规则方面设臵障碍,并将其对其他经营者进行不合理限制的行为定性为滥用市场支配地位的行为。草案也强调了国务院反垄断执法机构应当依法加强民生、金融、科技、媒体等领域经营者集中的审查,防止企业在技术优势的加持下,运用数据、用户流量和算法算力为数字经济的健康发展带来隐患。 3.数据技术合规 要求陆续出台 随着信息 科技 飞速发展,人脸识别、自动化决策等 技术开始逐步走进社会生产和人民生活 。与此同时, 信息 泄露、信息 滥用 等先进技术带来的个人信息 保护问题逐渐凸显,从技术层面强化安全合规监管的呼声日益高涨。 在人脸识别技术方面, 2021 年 7 月底最高人民法院发布了关于审理使用人脸识别技术处理个人信息相关民事案件适用法律若干问题的规定,以列举的方式明确了侵害自然人人格权益的行为类型,明确了处理人脸信息 时需获得单独同意且不得捆绑授权或变相强迫,让个人更加充分地参与到人脸信息处理的决策过程中,防止信息被无感知、捆绑式地收集。 大数据白皮书 16 在自动化决策方面, 除个人信息保护法的规制外, 2021 年8月 27日中央网信办 发布的互联网信息服务算法推荐管理规定(征求意见稿)着力于 解决算法推荐领域的乱象,建立 由网信部门、行业自律和社会监督相配合的全面监督管理体系。该规定要求对算法建立分类分级制度,对特殊算法推荐服务的提供者 进行 备案管理和安全评估。 表 1 国家数据立法列表(部分) 名称 发布主体 发布日期 工业和信息化领域数据安全管理办法(试行)(征求意见稿) 工信部 2021.9.30 征信业务管理办法 中央人民银行 2021.9.30 汽车数据安全管理若干规定 (试行) 网信办、发改委、工信部、公安部、交通运输部 2021.7.5 关于加强智能网联汽车生产企业及产品准入管理的意见 工信部 2021.7.30 关键信息基础设施安全保护条例 网信办 2021.7.11 数据出境安全评估办法 (征求意见稿) 网信办 2021.10.29 反垄断法(修正草案) 全国人大常委会 2021.10.23 关于审理使用人脸识别技术处理个人信息相关民事案件适用法律若干问题的规定 最高人民法院 2021.7.28 互联网信息服务算法推荐管理规定(征求意见稿) 网信办 2021.8.27 来源:中国信息通信研究院 (三) 地方立法:着力创新攻坚合规难题 随着数据合规立法逐渐进入深水区,地方立法充分发挥试点优势,探索数据确权、数据估值和数据流通等关键难题的解决之道。大数据白皮书 17 地方立法的先行先试将有助于推动地区数字经济发展,为国家制度创新积累经验,加速推动大数据的立法进程。 2021 年 7 月发布的深圳经济特区数据条例是国内数据领域首部基础性、综合性的地方立法。在个人数据方面,条例进一步明确了个人数据处理的合法基础和处理方式,强调个人信息主体撤回同意的权利;在数据市场方面,条例肯定了市场主体对合法处理形成的数据产品和服务享有的使用权、收益权和处分权,回应并规范了用户画像、定推及大数据杀熟等问题,强调充分发挥数据交易所的积极作用等。 2021 年 11 月 通过 的上海市数据条例积极探索数据确权问题,明确了数据同时具有人格权益和财产权益双重属性;在数据要素市场发展方面,提出建立数据资产评估、数据生产要素统计核算和数据交易服务体系等。 作为广东省首部数据层面的政府规章, 2021 年 10 月发布的广东省公共数据管理办法为规范公共数据管理,促进公共数据资源的开发利用提供了制度保障。办法首次明确将公共服务供给方数据纳入公共数据管理范畴,为公共数据的综合管理打下坚实的基础。为进一步促进数据交易的发展,办法在国内首次明确了数据交易的标的,强调政府 应通过数据交易平台加 强对数据交易的监管,弥补以往政府监管的空白。 大数据白皮书 18 表 2 地方数据立法列表(部分) 名称 发布主体 发布时间 深圳经济特区数据条例 深圳市人大常委会 2021.7 上海市数据条例 上海市人大常委会 2021.11 广东省公共数据管理办法 广东省人民政府常务会议 2021.10 来源:中国 信息 通 信研究 院 三、大数据技术体系发展创新变革 大数据技术的内涵伴随着传统信息技术和数据应用的发展不断演进,而大数据技术体系的核心始终是面向海量数据的存储、计算、处理等基础技术。支撑数据存储计算的软件系统是起源于 20 世纪60 年代的数据库; 70 年代出现的关系型数据库成为了沿用至今的数据存储计算系统; 80 年代末,专门面向数据分析决策的数据仓库理论被提出,成为接下来很长一段时间中发掘数据价值的主要工具和手段。 2000 年前后,在互联网高速发展的时代背景下,数据量急剧增大、数据类型愈加复杂、数据处理速度需求不断提高,大数据时代全面到来。由此,面向非结构化数据的 NoSQL 数据库兴起,突破单机存储计算能力瓶颈的分布式存储计算架构成为主流,基于Google三驾马车理论产生的 Apache Hadoop 成为大数据技术的代名词,MPP ( Massively Parallel Processing)架构也在此时开始流行。 2010 年前后,移动互联网时代的到来进一步推动了大数据的发展,对于实时交互性的进一步需求使得以 Storm、 Flink 为代表的流处理框架应运而生,对于庞杂的不同类型的数据进行统一存储使用大数据白皮书 19 的需求催生了数据湖的概念。同时,随着云计算技术的深入应用,带来资源集约化和应用灵活性优势的云原生概念产生,大数据技术完成了从私有化部署到云上部署再向云原生的转变。 来源:中国 信息 通 信研究 院 图 2 数据平台技术演变 2020 年开始,随着各行业数字化转型的推进、数据安全事件的频发,大数据技术的发展重点也从单一注重效率提升,演变为 效率提升、赋能业务、加强安全、促进流通 四者并重。 (一) 效率提升:利用云原生思想进行能力升级 2006 年,云计算开始发展后,随着各单位上云进程的加速,传统大数据平台和数据库逐渐从私有部署转化为云上部署,但变化主要集中在部署模式的不同,并未充分利用云计算理论为大数据技术本身赋能。而随着云原生概念的兴起,大数据技术产品逐步迭代升级,云原生大数据技术产品开始成为产业变革的浪潮。 大数据白皮书 20 表 3 近一年发布的云原生大数据技术 产品一览 时间 企业 产品 2020.12 阿里 云原生数据库 PolarDB 2020.12 腾讯 云原生数据库 TDSQL-C 2020.12 腾讯 云原生消息队列 TDMQ 2020.12 AWS Amazon Aurora Serverless V2 2021.5.14 腾讯 云原生数据湖 2021.5 阿里 云原生数据仓库 AnalyticDB 2021.5.17 华为 云原生数据湖产品 FusionInsightMRS 2021.9.28 百度 云原生湖仓架构 2021.10.20 阿里 云原生湖仓一体产品 2.0 来源:中国 信息 通 信研究 院 利用云原生,大数据技术产品从三个方面实现了效率提升 :一是整体架构为实现弹性伸缩进一步解耦和改造,架构 在以往存算分离的基础上,伴随调度、安全、解析等模块的进一步解耦,各模块与容器等底层资源单元适配,分别实现弹性扩缩容,从而实现 资源利用率 30%40%的提升;二是应用接口函数化 , 即利用 Serverless的概念,让更多如统计、机器学习、流程处理等能力封装成函数接口,用户可根据实际业务需要,达到更细粒度的按需使用和按需付费,在提升 23 倍发布效率的同时,也有效降低了成本 ; 三是支持多云部署 , 以 Snowflake 为代表的企业正尝试探索第三方云数据仓服务模式,即提升与各公有云的兼容能力,支持多云部署,方便客户在多云之间无缝迁移,从而降低客户被单一公有云绑定的风险 。 大数据白皮书 21 (二) 赋能业务:利用开发平台释放业务潜能 随着数字化转型的推进 ,各行业在完成数据基础设施建设后,为业务赋能的数据开发工作成为重点。 传统数据开发工作 大多 通过直接调用种类繁多的大数据开源技术组件 来进行,通常 需要 具备 专业知识的技术人员完成 ,业务人员很难 快速上手,然而伴随业务对于数据开发的要求不断提高 ,不同部门间 的高效协同成为完善数据开发工作、提高业务效率的关键。因此,数据开发工作逐渐从技术部门向各业务部门延伸, 数据开发的 门槛 也亟需降低以使数据与各业务加速融合。 2021 年,头部 科技 企业纷纷投入力量,研发并推出数据开发平台用于解决数据开发门槛高 的痛点,助力更多行业享受数字化转型的红利。典型产品包括阿里 云 Data Studio,云徙科技 数据研发平台,腾讯云 WeData 以及科杰 科技 Keen Studio 等。 数据开发平台是利用低代码思想, 通过抽象大数据开发过程中常用的技术和流程,屏蔽数据开发任务的技术细节 以及 提供统一的集成开发界面来降低开发门槛。与此同时 ,开发平台将统一 对各数据开发项目进行管理和资源整合,不仅 可以提升数据开发流程的透明度和规范性,而且可以 增强各组件在项目间的可复用性。根据统大数据白皮书 22 计 2,数据开发平台能够 将金融、零售、工业、医疗等不同场景下的开发组件复用率 增至 85%,将大大降低数据 的 开发成本。 来源:中国 信息通信研究 院 图 3 数据开发平台对数据开发工作的影响 (三) 加强安全:利用“零信任”补足内生安全 随着物联网、 5G、云计算的发展,数据生命周期涉及的节点数量变多、 数据形式 变新,信息泄露事件频发, 传统安全防护的边界已被颠覆 ,各行业 都需要延长针对数据各环节的 防御纵深,并建立以数据为 中心的新型 安全防护体系。 零信任理念旨在打破网络边界进行细颗粒度的访问控制,是目前针对数据安全体系的前沿探索。 零信任概念作为对传统网络边界保护方法的改进,背后的基本思想是在公司网络内、外部均不设臵安全区域或可信用户,而是将 2 统计数据来源:中国信通院大数据产品能力评测结果。 大数据白皮书 23 企业内、外部的所有操作均视为不可信任。围绕零信任的概念、设计、实施,各界提出了多种解决方案,如轻量级零信任网络访问模型,所有网络访问均遵循最小资源原则等 。 随着数据安全重要性的不断凸显,零信任概念也逐渐被引入到数据安全技术体系中。 2021 年,零信任解决方案厂商 Ericom Software 调研发现,超过 80%的企业计划在 1 年内向零信任安全架构迁移。此外,各技术厂家也陆续推出数据安全零信任体系, 2020年 12 月, Gartner 在综合评估了目前各厂家的零信任体系后发布报告 3,推荐了部分优秀零信任解决方案,其中包 括腾讯云与阿里云的零信任安全访问能力。 来源:中国 信息通信研究 院 图 4 企业 数据安全技术体系图 3 Gartner, SASE Will Improve Your Distributed Security Everywhere 大数据白皮书 24 (四) 促进流通:利用隐私计算保障数据流通 传统大数据技术对于数据在机构间的流通场景缺乏支撑,导致对外的数据融合应用与对内的数据安全保护总是难以兼顾。当侧重数据应用时,黑市交易猖獗、个人信息外泄的情况严重;而当侧重数据保护时,可流通的数据范围和数据对象受到限制,数据的价值难以发挥。近年来,隐私计算被认为是最有希望解决跨机构间数据有序流通问题的一类关键技术。 Gartner 发布 2022 年重要战略技术趋势,继续将隐私计算列为未来几年科技发展的重要趋势之一 。 从技术原理讲,隐私计算融合了密码学、人工智能、计算机工程等众多学科。从 20 世纪 70 年代发展至今,隐私计算已逐渐形成了以多方安全计算、联邦学习、可信执行环境为代表,混淆电路、秘密分享、不经意传输等作为底层密码学技术,同态加密、差分隐私等作为辅助技术的相对成熟的技术体系 。 来源:中国信 息通信研究 院 图 5 隐私计算技术体系 大数据白皮书 25 2021 年,隐私计算正在迎来市场爆发期, 在 政府多部门发文鼓励使用隐私计算技术 的背景之下,隐私计算的技术 产品数量快速增长,在金融风控、互联网精准营销、智慧医疗、政务数据共享与开放等数据规模大、数据流通需求强烈的场景中孵化出典型应用,并在智慧能源、智慧城市、工业互联网等领域持续探索。行业火热发展的同时也应注意到,隐私计算技术本身尚未完全发展成熟,如何