2017电信大数据应用白皮书.pdf
电信大数据应用白皮书 ( 2017 年) 大数据发展促进委员会 电信工作组 2017 年 3 月 版权声明 本白皮书版权属于数据中心联盟大数据发展促进委员会,并受法律保护。转载、摘编或利用其它方式使用本白皮书文字或者观点的,应注明“来源:数据中心联盟大数据发展促进委员会”。违反上述声明者,本委员会将追究其相关法律责任。 编写指导:杨子真、何宝宏、马源、郭顺义、魏凯、李海英 编写小组:梁屾、何阳、韩涵、刘寒、刘耀华、冯橙、陈浩、梁伟、杨瑞 前 言 在数字化时代,“数据是基础性资源,也是重要生产力”。电信企业数据资源丰富,电信大数据在推动经济发展、改善公共服务等方面,具有广泛的应用价值。电信大数据的应用发展既是促进大数据产业发展的重要内容,也是电信企业转型发展的重要方向。 本白皮书聚焦于电信大数据的应用发展情况,首先通过应用案例分析和实践成果调研等方式,形成国内外电信运营商大数据应用地图,从发展现状、应用优势、发展挑战等方面对电信大数据的应用情况进行了总结描述;然后深入分析了电信大数据应用发展所涉及的技术标准、安全保障、政策条件、法律风险和商业模式等具体内容;最后,针对电信大数据的未来发展趋势做出预判,并从行业和企业、技术和运营等不同角度,提出促进电信大数据价值应用的发展策略。 数据 中心联盟 大数据发展促进委员会电信工作组, 是中国通信 标准化 协会( CCSA) 的 下属机构,由中国信息 通信研究院牵头 , 联合业界专家学者构成。主要 职责 为推动电信大数据领域的 战略 规划咨询、技术标准 制定 及评测认证、业务法律风险评估、产业化推广等。 是电信大数据“司马”奖评选的发起单位。 目 录 一、电信大数据应用情况概述 . 1 (一)电信大数据应用的现状 . 1 (二)电信大数据应用的优势 . 4 (三)电信大数据应用面临的挑战 . 6 二、电信大数据应用的标准化与合规性 . 7 (一)电信大数据标准化进展 . 7 (二)电信大数据标准化技术要点 . 13 (三)电信大数据应用合规性标准化 . 16 三、电信大数据应用的政策基础与法律风险 . 19 (一) 电信大数据应用的政策基础分析 . 19 (二) 电信大数据应用的法律风险分析 . 20 (三) 电信大数据应用的法律风险控制策略 . 22 四、电信大数据应用的商业模式 . 23 (一)大数据产业的商业模式分析 . 23 (二)电信大数据应用的商业模式定位 . 25 五、电信大数据应用的发展趋势 . 27 (一)电信大数据应用正迎来快速发展的重要机遇期 . 27 (二)金 融、政务、交通、旅游等热点领域的应用不断深化 . 28 (三)以视频为代表的非结构化数据的分析应用成为新趋势 . 28 (四)物联网、人工智能、 AR/VR 等成为大数据应用发展的新动力 . 29 (五)面向大众市场的个性化大数据服务将成为新领域 . 29 六、电信大数据应用的发展策略 . 29 (一)整合行业数据资源,促进对外应用协同发展 . 29 (二)强化数 据安全风险管控,明确各方主体安全责任 . 30 (三)实现数据 “资产化 ”管理,提升数据运营能力 . 30 (四)专业化和独立化运营,拓展对外创新合作模式 . 31数据中心联盟 电信大数据应用白皮书 1 一 、 电信大数据应用情况概述 (一)电信大数据应用的现状 1.我国电信大数据应用起步晚于国外,但成长迅速,呈赶超态势 当前,电信大数据应用呈现蓬勃发展态势。综合国内外情况来看,2011-2012 年间,国际运营商领先开始进行大数据业务布局,打造大数据应用平台,从内部应用大数据支撑运营起步,以基于位置的对外精准营销服务为突破点,不断丰富和深化在零售、医疗和智慧城市等多个垂直领域的数据应用和价值变现。经过近 5 年发展,国际运营商大数据运营能力已逐渐成熟,大数据应用市场正处于稳定发展期。 图 1-国内外电信大数据 应用发展历程 我国运营商在 2013-2014 年间,先后逐步明确将大数据业务定位于公司转型与创新发展的重要战略方向,通过构建大数据能力平台、设立大数据业务专业化运营团队等措施,逐步形成大数据应用发展基础能力。在成长期,内外部应用同步拓展,实现大数据在市场营销、网络优化和运营管理等多个层面的应用支撑,并以金融、政务等垂直领域为试点,不断拓展对外数据价值应用变现渠道。目前,我国大数据应用市场需求不断增长,大数据相关产业技术不断成熟,电信大数数据中心联盟 电信大数据应用白皮书 2 据应用正处于快速发展期。 2.运营商重点布局零售、医疗、金融、政务和智慧城 市等领域 从对外应用方向上看,运营商大数据应用重点在零售、医疗、金融、政企和智慧城市等领域,主要是基于用户属性、使用行为和位置信息等数据内容,形成清晰、准确的用户个人画像,建立理想的目标人群模型,为各垂直行业的合作方提供精准营销、客流统计、商业选址、信用分析、安全预警等数据支撑服务。在具体的热点应用领域方面,由于社会经济发展条件的差异,国内外运营商的电信大数据应用热点领域既有共同点,也存在明显的差别。 图 2-国际运营商电信大数据应用领域分布 以上是从电信大数据的应用方向与行业领域两个维度,绘制的国际运营商电信大数据应用的热点领域分布地图。从图上可以看出,零售、医疗和智慧城市是国外运营商最主要的大数据应用领域。而在国内,一是由于我国金融征信产品较为单一,且个人征信覆盖率较低,为金融领域的电信大数据应用创造了条件,所以基于电信大数据的金融征信服务领域成为运营商布局热点。二是基于大数据应用安全风险数据中心联盟 电信大数据应用白皮书 3 的控制要求,同时在各级政府信息化发展需求仍具有较大空间的情况下,政务领域成为电信大数据应用的另一重点。从数据中心联盟 2017年度电信大数据“司马奖”的申报成 果数量来看,国内电信大数据对外应用方面,金融和零售并列排在首位,占比均为 14.55%,其后依次为政务、旅游和智慧城市,占比分别为 12.73%、 10.91%、 9.09%。 图 3-2017 年度电信大数据“司马奖”申报成果应用领域分布图 3.内外部同步推进,但仍以电信企业内部应用更为深入广泛 目前,全球主流电信运营商在大数据应用方面的思路比较一致,结合国际运营商大数据应用地图和国内电信大数据“司马奖”评选成果收集情况来看,对内利用大数据技术支撑公司运营管理仍是大数据应用的首要选择。对外基于自身数据资源优势开发 大数据产品,内部商业应用和外部商业拓展同步推进。由于电信运营商掌握的是几乎所有个人和部分设备的行为数据,外部商业拓展理论上能够在几乎所有行业领域内发挥价值,但出于用户隐私保护、数据共享安全等因素的考虑,目前外部应用范围有限。电信行业内部大数据应用相比之下开展得更加深入和广泛,包括基于用户画像的精准营销、流失预警、网络优化、服务优化等。 数据中心联盟 电信大数据应用白皮书 4 4.专业化和独立化是电信企业大数据业务发展主要策略 大数据业务具备典型的移动互联网产品特征,与传统电信业务有较大差异,需要更加灵活的运营管理模式。根据国际运营商的实践经验,大 数据业务运营均是以产品为核心,整合此前分散在各部门的设计研发、营销推广和客户服务等运营环节,构建专业化的大数据业务运营体系。电信企业主要是通过成立专门的大数据业务发展部门或新公司,来实现更加灵活的大数据业务开发和对外合作机制。如西班牙电信率先成立名为“动态洞察”的大数据业务部门; Verizon 成立了基于大数据分析的精准营销部门 Precision Marketing Division;新西兰电信成立独立的大数据子公司 Qrious。 (二)电信大数据应用的优势 1.数据规模大、类型丰富,数据覆盖深度和广度不断拓 展 电信大数据在数据规模、数据精准性和多样性方面,具有突出的价值优势,而且随着物联网的不断发展,万物互联带来电信大数据覆盖深度和广度的不断拓展。数据规模方面,工信部统计数据显示, 2016年 我国三大运营商 电话 用户达 15.3 亿 户, 移动用户 13.2 亿 , 固定电话 2.07 亿 。 在如此庞大规模的 用户基础之上,运营商每天搜集的数据可达 PB 级。 数据准确性 方面, 运营商以号码为唯一的 ID 来整合各类数据,并且 手机号码实名登记, 我国 目前手机实名登记率达 95%,这 充分保证了电信大数据的真实可靠 。 数据多样性 方面, 运营商 的数据包括通话 数据 、位置 数据 、 用户属性数据、用户上网数据 、手机 消费数据 、 终端 数据等 ,数据类型涵盖结构化的用户基本信息数据、半结构化的用户访问日志数据、非结构化的流媒体数据等 。 数据中心联盟 电信大数据应用白皮书 5 2.数据基础设施发展迅速,数据存储和传输能力优势明显 一是在数据 存储方面,运营商 “遍布全国、深入市县、重点覆盖”的数据中心建设布局, 为电信大数据 奠定了良好的 存储服务 基础 。 据统计,在我国的 IDC 数据存储服务领域,三大运营商共同占据超过 60%的市场份额 1。二是 数据传输方面,确保 网络不间断运行, 进行 大容量、高稳定性、高可靠性地 传输是运营商的 天然优势 。 2016 年 , 我国光缆线路总长度 3041 万公里,互联网宽带接入端口数量达到 6.9亿个,移动 基站总数达到 559 个 2。电信企业具有遍布全国的传输网络,在网络带宽、网络覆盖和网络维护等方面拥有绝对领先的能力优势,为电信大数据分布式节点的应用通信提供了最可靠的保障。 3.数据应用价值广泛,能有效促进经济发展、改善公共服务 电信网络是信息化社会的基础支撑,承载大量国民经济活动。电信 大数据与各行各业 的 融合 应用 可直接 支撑 我国社会和国民经济发展的方方面面。 例如电信大数据 与人口 数据 结合可绘制出人口迁徙地图; 电信大数据 与交通数据结合可以 指导城市 交通管理 ; 电信大数据与商业数据结合 可为 商圈店铺 选址提供分析服务等。随着物联网、工业互联网等深化拓展,多样化智能终端的全面普及,将使电信大数据在智能制造、工业 4.0 等新型工业化领域拥有广阔的应用空间,能够有力支撑传统经济的信息化转型,促进“互联网 +”战略的落地实施。 4.“电信级”标准与规范能力奠定数据 安全 保障基础 电信业 从诞生之日起, 就是 基于 严谨 的电信级标准框架协议而构建的 ,例如 802.1 的 交换 /信令控制标准、 802.1ah 的 数据平面技术标准等 。长期以来 , 安全 、稳定的 “电信级”标准已 深入电信业的基因。1 数据来源: 2016-2022 年中国 IDC 行业市场运营态势报告 2 数据来源 :工信部统计数据 数据中心联盟 电信大数据应用白皮书 6 基于 CT 行业长期标准化、规范化的严格要求,电信企业在业务管控、网络保障、用户信息安全等方面经验丰富。目前,我国运营商在数据获取、存储、处理、管理、交易等多个环节,已经逐步形成了明确的大数据业务发展规范。对于政府和企业而言,具有安全保障基础优势的电信运营商,是进行大数据应用合作最为可靠的选择对象。 (三)电信大数据应用面临的挑战 1.市场应用需求有待培育,数据交易缺乏规范化管理 电信大数据的应用需求仍不成熟,除了精准营销、金融征信等个别领域,医疗、教育、交通等大部分垂直领域的应用需求仍处于较 低水平,客户对于电信大数据应用价值、应用方式的认识不足,市场培育和开发的压力仍较大。同时,全国性的大数据交易市场建设仍处于初级阶段,在交易渠道、交易方式、数据定价和技术支撑等多个方面均存在盲区,大数据交易过程中各细分领域的专业化水平低,服务能力不足,而且相关政策法规还处于构建期,整个大数据交易过程的规范化管理能力明显不足。 2.行业协同能力不足,应用拓展缺乏统一协调规划 电信大数据的对外应用和价值变现,需要形成行业统一步调和声音。尤其是跨领域和跨行业的应用,行业协同对于保障电信大数据应用价值,提升电信企业 议价能力十分关键。同时,电信企业的统一协调,对于争取电信大数据发展的政策扶持、资金投入和社会舆论关注也具有重要作用。目前的电信大数据应用仍处于各自为战的态势,各家电信企业缺乏协同,力量分散,绝大部分应用案例规模小、范围窄、层次不高,缺乏突出性的社会影响力,制约了电信大数据的应用拓展。 3.数据安全标准仍存在多方面缺失,风险管控压力大 数据中心联盟 电信大数据应用白皮书 7 电信大数据涉及用户个人隐私,在用户数据安全和信息保护方面要求严格。如何在数据交易过程中,有效规避数据安全风险,切实做好数据安全管理和保障,是电信大数据应用发展必须面对的重大挑 战。当前,大数据安全领域的相关标准仍处于探索期,涉及电信大数据应用的安全规范更是存在较多空白。在缺乏行业统一安全标准和管理规范的情况下,单纯依靠企业自身管控,会带来较大的安全管控风险。 4.电信企业数据管理能力有待提升,软件开发能力短板仍较突出 电信企业传统的数据系统是“烟囱”式建设,数据分散在各个系统中,缺乏统一的数据存储管理标准,“三域”数据整合仍处于建设阶段,不同领域的数据壁垒仍较为明显,而且系统改造难度大,短期内难以改变。同时,现有的数据采集和应用分析能力是基于传统结构化数据形成的,难以满足大数据业 务的海量数据存储和非结构化多样性数据计算要求,数据需求响应速度慢,个性化分析能力不足。此外,传统电信业务的多层级运营架构,难以适应大数据业务的灵活运营特点和快速创新趋势。对我国电信企业而言,发展大数据业务在组织架构、人才储备和运营流程等方面均面临较大的转型调整压力。 二、电信大数据应用的标准化与合规性 (一)电信大数据标准化进展 近年来, ITU-T、 CCSA 、 ISO/IEC、 NIST、全国信标委大数据标准工作组等国内外标准化组织已经积极开展大数据的标准化工作,取得了一些初步成果。其中 ITU-T 和 CCSA 由于其标准组织性质及参与方在产业链担当的角色,更侧重电信大数据的标准化工作。 1.ITU-T ITU-T 的大数据标准化工作主要在 SG13(第 13 研究组)开展。数据中心联盟 电信大数据应用白皮书 8 2017-2020 新一研究周期伊始, SG13 的架构进行了重新调整, WP2(第2 工作组)主要专注于云计算和大数据领域的标准化研究,其中包含Q7(课题 7)、 Q17(课题 17)、 Q18(课题 18)、 Q19(课题 19),各课题组研究范围如下表所示 : 表 1- WP2 工作组课题研究范围 序号 课题组 研究范围 1 Q7 大数据驱动的网络及应用、 DPI 相关需求和架构标准化 2 Q17 云计算和大数据的需求、生态和通用能力标准化 3 Q18 云计算和大数据的功能架构标准化 4 Q19 端到端的云计算管理及安全、大数据治理标准化 截止目前, ITU 发布了 1 项大数据正式标准、 1 项补充标准,有 6项正式标准和 2 项补充标准在研。 ( 1) Y.3600( Y.BigData-reqs 大数据 -基于云计算的需求和能力 ,Q17/SG13)是 ITU-T 发布的首项大数据标准,由中国电信主导,法国电信、韩国电子技术研究院联合制定。对大数据的定义、特征、生态系统、功能需求等进行了标准化。从数据采集、数据预处理、数据存储、数据分析、数据可视化、数据管理、数据安全与保护等 7 个方面详细定义了大数据的功能需求和能力需求。该标准规范的内容为ITU-T 后续制定大数据系列标准提供基准和参考。 ( 2) Y.Suppl.BigData-RoadMap(大数据标准化路线图 ,Q17/SG13)是 ITU-T 发布的补充标准,由韩国电子技术研究院牵头制定,定义了ITU-T 的大数据标准化路线 图,是电信大数据标准化工作的指导文件。同时,分析了 ITU-T 及其他国际标准化组织在大数据标准化工作上的进展,将已发布或在研标准进行了分类,与 Y.3600 中定义的大数据在其生命周期的不同处理阶段进行了对应,反映了大数据标准化工作的数据中心联盟 电信大数据应用白皮书 9 焦点和空白。 ( 3) Y.BigDataEX-reqs(大数据交易框架和需求 , Q17/SG13)、Y.BDaas-arch(大数据即服务的功能架构 , Q18/SG13)、 Y.bDDN-fr(大数据驱动的网络框架, Q7/SG13)、 Y.bDDN-reqs, Y.Sup-bDDN-usecase(大数据驱动的网络需求,大数据驱动的网络 -增补用例, Q7/SG13)、Y.bDDN-MNTMP(大数据驱动的移动网络流量管理及网络规划,Q7/SG13)等 6 项标准目前均处于在研阶段。 2SA CCSA 作为通信标准化研究组织,在 2013 年也开始了电信大数据相关的标准化工作。在 TC1、 TC5、 TC7、 TC8、 TC10、 TC11 等工作组,均有电信大数据相关的标准项目在研,涉及电信大数据需求、应用、平台架构、安全、开放、质量管理、测试等方面。发布行业标准 1 项,发布研究课题 1 项,在研行业标准 5 项,在研研 究课题 8 项。 ( 1)移动大数据安全技术研究(研究课题, TC5/WG5)。该项研究课题由中国联通牵头,研究了大数据安全的基本定义、科学内涵、体系框架、关键技术、保障机制、应用场景等内容,明确大数据安全的研究方向、基本内容、关键技术和应用实践,预测大数据安全的适用场景和发展趋势。目前完成报批稿。 ( 2)电信运营商的大数据应用业务安全技术要求(行业标准,TC8/WG2)。该项行业标准由中国联通牵头制定,适 用于运营商对外合作中的各类大数据应用业务,规定了运营商大数据应用中的安全框架与保障机制,包括大数据应用业务流程与安全管控框架、大数据采集安全技术要求、大数据存储安全技术要求、大数据挖掘安全处理技术要求、大数据输出审计安全技术要求、大数据传输安全技术要求、大数据运营安全技术要求。目前完成报批稿。 数据中心联盟 电信大数据应用白皮书 10 ( 3)电信互联网大数据开放平台标准化研究(研究课题,TC1/WG4)。该项研究课题由中国信息通信研究院牵头,中国电信、中科院计算机网络信息中心(中国互联网络信息中心)、中兴通讯、中科学声学研究所、华为、上海贝尔、中国 联通参与,结合国内外大数据技术应用发展的趋势和大数据开放平台的建设实践,重点围绕促进互联互通、数据安全和隐私保护等目标,系统分析大数据开放平台建设、运营、监管中的标准化需求,梳理国内外已有研究基础,提出标准化研究的思路、目标和下一步工作建议。目前完成征求意见稿。 ( 4)移动互联网大数据技术研究(研究课题, TC11/WG1)。该项研究课题由中国联通牵头,北京邮电大学、中国电信、上海贝尔参与,研究了移动互联网大数据的范围、数据模型、体系框架、关键技术、保障机制、应用场景等内容,为大数据应用提供技术参考和业务发展 建议。目前已发布。 ( 5)大数据管理功能框架研究(研究课题, TC7/WG3)。该项研究课题由大唐电信牵头,北京交通大学、北京邮电大学、北京市天元网络技术股份有限公司参与,研究大数据管理框架及描述方法,分析大数据管理所涉及的功能及活动,为大数据管理相关系统的开发、选型提供参考和指导。目前已完成报批稿。 ( 6)中国信息通信研究院牵头的大数据需求、场景及架构研究(研究课题 ,TC1/WG4)、北京交通大学牵头的大数据运维技术与标准研究(研究课题, TC7/WG3)、中国联通牵头的大数据环境下数据质量要求与数 据质量评估方法研究(研究课题, TC1/WG4)、中国联通牵头的面向大数据的数据可视化需求与技术研究(研究课题,TC1/WG4)、中国联通牵头的基于电信大数据的金融征信技术研究(研究课题, TC11/WG2)、中国信息通信研究院牵头的大数据基数据中心联盟 电信大数据应用白皮书 11 础平台测试方法系列标准:可用性、性能、安全、兼容性、运维(行标, TC1/WG4)等标准和研究课题目前均处于征求意见和在研阶段。 3.ISO/IEC ISO/IEC、 NIST、全国信标委大数据标准工作组,侧重于通用大数据的标准化工作,可适用于电信大数据的各个处理 环节,并可为其标准化工作提供指导和借鉴。 ISO/IEC JTC1 WG9 是 ISO/IEC 专门设立的大数据工作组,负责开发大数据基础性标准,包括参考架构和术语;识别大数据标准化需求;同 JTC1 其他工作组及 JTC1 外部其他大数据标准化组织保持联络。目前, WG9 正在研制 ISO/IEC 20546大数据概述及词汇、 ISO/IEC 20547大数据参考架构两项标准。其中,大数据参考架构又分为框架和应用过程、用例和衍生需求、参考架构、安全和隐私保护以及标准路线图 5 个部分。 4.NIST 美国国家标准与技术 研究院( National Institute of Standard and Technology,NIST)的 NBG-WG 小组是最早开展大数据标准化工作的组织,在国际上享有很高的声誉。工作组下设术语和定义、用例和需求、安全和隐私、参考体系结构和技术路线图 5 个分组。目前,已经发布大数据定义、大数据分类、大数据用例和需求、大数据安全和隐私需求、大数据参考架构调研白皮书、大数据参考架构、大数据路线图等输出物 v1.0 版本,同时 v2.0 版本研究工作正在展开。 5.数据 中心联盟大数据 发展 促 进委员会电信工作组 数据中心联盟大数据发展促进委员会( China Big DataCouncil,简数据中心联盟 电信大数据应用白皮书 12 称 BDC)由工信部、网信办、发改委指导,于 2016 年 7 月 1 日正式 成立 ,挂靠于 中国通信标准化协会 ( CCSA) 。 委员会 定位为 凝聚内外资源,加强大数据相关工作的系统性和前瞻性,为政府主管部门、大数据技术和产品用户以及供给方搭建一个高端交流合作平台,务实推动大数据产业发展。委员会由大数据领域的知名企业家、学者、行业专家和致力于大数据发展的有识之士组成。关注于大数据软硬件产品、大数据行业应用、数据资源流通等关键领域,聚 焦互联网、电信、金融、健康、工业等垂直行业,由 办公室统筹大数据委员会的工作进度。 在 委员会的组织下, 由中国信息通信研究院、中国电子科学技术研究院、中国联通、中国电信、阿里巴巴、京东、 360、世纪互联、滴滴出行等 80 多家单位共同发起数据流通行业自律公约,公约将解决数据流通领域长期缺乏行业规范问题,标志着该领域初步达成行业共识。 委员会下设电信 大数据工作组,负责电信大数据 行业 标准的制定,评估 评测以及应用推广。 电信 大数据工作组已经初步完成 通信 行业大数据对外应用的系列联盟标准 。 其中,大数据 产品 能力 认证标准包括 : Hadoop 平台基础能力测试方法 1.0 MPP 数据库基础能力测试方法 1.0 Hadoop 平台性能测试方法 1.0 数据流通应 用合规性标准包括: 数据流通标准:通用标准 数据流通标准:征信类产品及服务标准 数据流通标准:金融风控类产品及服务标准 数据流通标准:数据流通中心数据处理及业务管理标准 数据中心联盟 电信大数据应用白皮书 13 数据流通标准:精准营销类产品及服务标准 数据流通标准:区块链应用场景标准 数据流通标准:位置信息类产品及服务标准 目前委员会已经 开展了第一轮 标准 符合性测评并正式发布 测试结果。 通过产品 能力认证以及数据使用 合规性 认证 , 以 标准化 的 手段积极 推动电信大数据的蓬勃发展和产业化推广。 6.全国信标委大数据标准工作组 全国信标委大数据标准工作组于 2014 年 12 月 2 日成立,主要负责制定和完善我国大数据领域的标准体系,组织开展大数据相关技术和国家标准的研究,组织推进国际标准化活动,对口 ISO/IEC JTC1/WG9 大数据工作组。其下设置 7 个专题组:总体专题组、国际专题组、技术专题组、产品和平台专题组、安全专题组、工业大数据专题组、电子商务大数据专题组,负责大数据领域不同方向 的标准化工作。目前,正在研制的国家标准有 10 项,主要 为大数据整体架构标准, 与 电信大数据密切相关的内容较少。 (二)电信大数据标准化技术要点 随着大数据的发展,电信运营商的数据价值得到了充分认同,应用模式也越来越丰富。但由于电信运营商的数据价值高且涉及到个人信息的应用,所以在采集、处理、分析、应用及安全管控和组织管理等关键环节都有必要根据数据特征、使用流程、应用模式等因素进行标准化研究,指导电信大数据创新应用。 1.数据资源标准化 电信运营商经过多年发展,积累了大量数据,按照数据的描述内容及主体不同,可以分为 用户数据、企业内部数据、合作企业数据和数据中心联盟 电信大数据应用白皮书 14 外部数据四类。 ( 1)用户数据指同电信运营商签订服务协议的用户资料基础数据和相关业务数据,包括个人用户数据、企业用户数据和业务数据。其中,个人用户数据包括用户姓名、性别、出生日期、身份证号、住址、电话号码、固网上网账号及密码、客服密码、单位、职业、社保、驾照、终端号、卡号、社交网络账号等;企业用户数据包括负责人、联系人、企业联系方式、 IP 地址、法人信息等;业务数据包括使用电信运营商服务的时间、地点、行为、账务等信息。 ( 2)企业内部数据指电信运营商集团、省分公司、直属 单位及各级 IT 系统的经营、管理、财务、资源、网络、产品等数据。 ( 3)合作企业数据指同电信运营商签订合同共同发展服务合作的基础数据、渠道数据、业务发展数据及各级代理商数据。 ( 4)外部数据指电信运营商通过协议方式进行购买、转让、接入的其他企业和机构的数据。包括具有独立法人资格的全资子公司、合资公司及合作机构等外部单位。 2.技术处理标准化 ( 1)数据加密方面,敏感数据在采集、存储、传输和应用过程中应对敏感字段进行脱敏和加密处理,包括电话号码、姓氏名字、住址、 IMEI 号等,并应对任何数据操作进行日志记录和留存 。数据存储方面,分布式块存储在替代传统 RAID 设备方面也有长足进展,分布式对象存储则在提供海量廉价存储容量方面具有极大优势。一是进一步扩大分布式存储应用场景,降低大数据存储成本,仍是电信大数据存储的进一步发展方向。二是需要通过引入 SSD 盘、引入缓存技术等软硬件方案进一步提升分布式存储性能,避免其访问效率成为影响大数据处理性能的瓶颈。三是大量 DPI数据存储在分布式数据库系统中,数据中心联盟 电信大数据应用白皮书 15 对于实时性要求较高的应用,需要采用分布式内存数据库。 ( 2)建立大数据能力开放体系,数据集中汇聚,能力分级开放,应用百花齐放,在整合与 清洗很多跨专业的原始数据的基础上,进行统一数据汇聚、统一数据处理、数据模型分层设计,建立标准化的数据共享服务目录,满足各类应用需求。 ( 3)电信基础数据(如主数据、指标等)缺乏统一的标准和管控,因为缺乏标准引发更多的数据重复存放、逻辑关系错误、解释口径不一等问题,亟需建立一体化数据管控和数据资产运营管理体系,实现数据有效治理。平台建设内容应包括数据查询,即各种报表和指标数据;数据资源挖掘,内外部数据使用平台,对内提供非敏感数据的汇总、标签等数据,对外可以用来部署各类挖掘模型,提供用户需要的数据结果;接口规范 ( SFTPAPI),满足批量数据传输和用户数据请求等各类应用需求。 3.安全管控标准化 ( 1)建立统一接入平台。电信运营商在进行对外数据提供时,应建立统一的数据接入平台,在软硬件更新和防护、漏洞扫描等安全手段基础上,根据访问数据和实际业务的具体情况,设置 IP 控制、访问权限控制、测试环境设置等具体管理手段。 ( 2)对于可以进行产品化的大数据产品,应建立完善、明确的数据产品体系。产品上线前,应经过业务部门、法务部门、安全管理部门的审 核,制定相关的管理规范和实施细则。在产品及服务提供过程中,应进行运行审查,发现安全隐患应及时停止,并进行评估和审核,通过后方可继续运行。 ( 3)在数据对外合作时,应签订明确的客户协议、开发协议、授权协议等协议,对于用户授权、数据应用、权责分配、保密责任、数据中心联盟 电信大数据应用白皮书 16 接入细节等内容进行约定,并保留业务实施过程中的相关记录作为发生纠纷时的溯源手段。 ( 4)明确各部门在大数据经营中的责任和义务。设计对象包括集团公司、法务部门、市场部门、客服部门、信息安全部门、运维部门、业务部门等。 ( 5)建立切实可行的考核制度及奖惩措施。将 大数据安全纳入部门及个人年度考核指标体系,对于造成数据泄露等安全时间的部门及个人进行绩效扣分、行政处罚,情节严重并触犯法律法规的交由司法机关处理。 (三)电信大数据应用合规性标准化 电信运营商经过多年的业务运营,积累了包括 B 域、 O 域、 M 域、DPI、信令、位置等网络数据,增值业务、行业和公众客户等应用数据,终端、渠道、自营平台等海量数据,涵盖人、产品、账务、营销、时间、地域、资源和财务等各类要素。随着内部数据需求和外部单位数据合作需求的快速增加,数据采集、流通和应用安全风险不断增大,为保证数据服务的安全性和合 规性,需要建立健全包括文档、制度、流程、技术、人员、审核等全面的标准化手段和保障机制,在保证数据安全的前提下发挥数据价值,提升数据服务能力。 1.合规依据 电信大数据合规应用应严格遵守国家、地方及行业法律法规,尊重商业道德及社会公德,践行相关标准及规范,不得损害国家利益、社会公共利益及公民合法权益。电信大数据应用应遵循全国人民代表大会常务委员会关于加强网络信息保护的决定、电信和互联网用户个人信息保护规定(工业和信息化部令 【第 24 号】)、侵害消费者权益行为处罚办法及其他相关法律法规对个人信息保护 的相关规数据中心联盟