数据新视界:从边缘到云激活更多业务数据.pdf
数据新视界:从边缘到云,激活更多业务数据 | 1 | 数据新视界 从边缘到云,激活更多业务数据 IDC 提供调研与数据分析 希捷科技报告 数据新视界:从边缘到云,激活更多业务数据 | 2 | 关于本报告 . 03 调研结果摘要 . 04 调研结论重点 . 05 第一部分:全球调研结果 第 1 章:数据的增长与扩张 . 07 第 2 章:数据宝藏 . 13 第 3 章:多云架构 . 19 第 4 章:数据管理挑战和多云生态系统 . 24 第 5 章:数据运营:数据管理的缺失一环 . 29 第 6 章:更佳业务成果 . 33 第 7 章:数据安全和数据管理 . 36 第二部分:区域调研结果 第 1 章:亚太区和日本 . 40 第 2 章:中国 . 44 第 3 章:欧洲 . 48 第 4 章:北美 . 52 目录 数据新视界:从边缘到云,激活更多业务数据 | 3 | 关于本报告 本报告是基于希捷赞助、独立研究 机构国际数据公司 (IDC) 于 2019 年 12 月到 2020 年 1 月开展的一项全球 调研。希捷以此次调研结果以及 IDC 的分析为基础撰写了本报告,分享 相关预测和观点。本报告中不直接 归属于 IDC 或 IDC 分析师的任何 内容、数据、分析或观点,均属希捷 独有。 此次定量网络调研共覆盖 加拿大、美国、英国、法国、德国、 俄罗斯、澳大利亚、日本、印度、 韩国、中国、中国台湾地区等大中型 企业的 1500 名受访者,其中北美 375 人、欧洲 475 人、亚太地区和 日本 500 人,以及中国 150 人。 受访者的职务涵盖首席信息官、首席 技术官、 IT 副总裁、总监、主管、 首席运营官/ 业务负责人、存储架构师 和解决方案架构师。 过去 40 多年来,希捷科技一直是全球领先的数据存储和管理解决方案提供商。 公司致力于以独创科技打造数据圈,不断创新,提供世界一流、精密设计的 数据管理解决方案,并专注于可持续发展的合作伙伴关系,从而最大限度地 发挥人类的潜力。 数据新视界:从边缘到云,激活更多业务数据 | 4 | 调研结果摘要 今天,数据空前地增长和扩张,并在 复杂多变的生态系统(包括多云和 边缘)中以各种方式流动。数据位置 的复杂性加剧了企业数据管理的 挑战。对企业来说,大多数可用的 数据并未得到利用。 本次调研旨在寻找解决目前数据管理 难题的解决方案:DataOps(数据 运营)将数据创建者与使用者 进行连接的重要环节。采用 DataOps (数据运营)的企业领导者有望获得 更好的业绩。 数据新视界:从边缘到云,激活更多业务数据 | 5 | 调研结论重点 未来两年,企业数据预计将以每年 42.2% 的速度增长。 在可用的企业数据中,仅 32% 投入 使用,剩余的 68% 并未得到利用。 平均而言,企业目前定期将大约 36% 的数据从边缘传输到核心。 两年后,这一比例将增至 57%。 从边缘立即传输到核心的数据量将 翻倍,从 8% 增长到 16%。这意味 着企业将管理更多的动态数据。 预计未来两年,管理多云生态系统 中的数据是最大的数据管理挑战, 其次是管理混合云中的数据。 将数据投入使用的五大阻力来自: 1) 将采集的数据变为可用;2) 已采 集数据的存储管理;3) 确保需要的 数据得到采集;4) 确保采集数据的 安全;5) 将采集的数据孤岛变为 可用。 应对大量数据管理挑战的解决方案 是数据运营 (DataOps)。通过数据 运营,将数据创建者与使用者联系 起来。平均只有 10% 的企业全面 实施了数据运营。但大多数受访者 表示,数据运营“非常”或“极 其”重要。 数据运营结合其它数据管理解决 方案使用能够显著改善业务效果, 包括提高客户忠诚度、收入、利润 以及其他许多裨益。 改善数据安全是企业将数据进行中 央存储管理的最重要驱动因素。 三分之二受访者表示自己企业数据 安全存在不足,因此数据安全成为 有效数据管理讨论的基本话题。 数据新视界:从边缘到云,激活更多业务数据 | 6 | 全球 调研结果 第一部分 数据新视界:从边缘到云,激活更多业务数据 | 7 | 第 1 章 数据诉说历史,描绘当下,勾勒未来。 数据的 增长与扩张 希捷观点 2020 年:企业数据总量达到 1PB 其他位置存储 160TB 边缘和远程位置存储 390TB 第三方数据中心存储 407TB 云端 (公有云、私有云、行业云) 存储 498TB 内部数据中心存储 570TB 其他位置存储 89TB 边缘和远程位置存储 193TB 第三方数据中心存储 201TB 云端 (公有云、私有云、行业云) 存储 221TB 内部数据中心存储 297TB 2022 年:企业数据总量约为 2.02PB 2 年中年均增长率 +42.2% 预计数据年增长率 数据来源:希捷数据新视界调研报告 1 , IDC, 2020 年 1 希捷数据新视界调研报告 基 于 IDC 调研数据, IDC 调研结果在本报告中进行了相关讨论。 地球人口已达 78 亿,而且还在 继续增长。居家办公成为新的 趋势。物联网 (IoT)、边缘计算、 边缘数据中心、人工智能 (AI) 等 技术不断普及。消费终端设备的 需求不断增长。所有这些因素都 导致企业数据激增。 为了更好地管理不断增长的信息量, 企业领导必须了解:大量数据是 如何产生,在哪里产生的。有两个 概念可以帮助我们说明这种趋势: 增长和扩张。 数据增长是指数据圈随时间增加的 百分比。数据圈是指不断扩张的 人类数据维度,无限映射并放大人 类生活。 数据扩张描述的是这些不断增长的 数据在不同配置位置的传输,从终 端到边缘再到云端。 图 1 数据新视界:从边缘到云,激活更多业务数据 | 8 | 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 内部管理的 企业数据中心 第三方管理的 企业数据中心 边缘数据中心或 远程位置(数据 集中存储) 云端(公有云、 私有云、行业云) 其他位置 全部 北美 中国 欧洲 亚太和 日本 电信 媒体 制造业 其他交通/ 智能驾驶 数据增长的速度可谓史无前例, 并将继续下去。本次调研发现, 从 2020 年初到 2022 年初的两年 时间里,企业创建的数据量将 每年增加 42.2%。为预测企业 数据量,IDC 采用了企业存储容量 作为指标(图 1 )。 此次调研的数据显示:拉动存储 数据增长的最重要因素有三个: 1. 数据分析不断增加。 2. 物联网设备逐渐普及。 3. 云迁移活动。 数据扩张反映的是企业数据的扩散 情况。 企业数据并非存储在一个位置, 这增加了数据管理的复杂性。 本次调研的受访者表示,大约 30% 的数据存储在内部数据中心,20% 存储在第三方数据中心,19% 存储 在边缘数据中心或远程位置,22% 存储在云端,还有 9% 存储在其它 位置。未来两年,这种分散状况 不会发生显著改变,意味着在可以 预见的未来,企业存储环境仍将 保持这种分散和复杂的状况。 企业越来越需要管理分散的数据, 无论它们所处何地。 调研结果 2 年后数据的存储位置(平均数量)图 2 IDC 数据 数据来源:希捷数据新视界调研报告, IDC, 2020 年 数据新视界:从边缘到云,激活更多业务数据 | 9 | 驱动创新的不是发展趋势,而是创造更多价值的需求。需要突破的极限 无处不在,实现数据的全部价值便是其中之一。 看看我们这个数据驱动的世界。数据在不断增长,并且增速不断加剧。 到 2025 年,数据创建总量将大幅增长至 175ZB。现在每小时创建的 数据要比 20 年前一整年创建的数据还多。数据是人类的潜能,最敏锐 的头脑会尝试去驾驭数据的力量。 限制我们挖掘数据全部潜能的因素既有系统层面的,也有操作层面的。 当数据达到 ZB 规模时,我们需要一种简单、安全、经济有效的方式来 获取、存储和激活数据。数据的使用者不想操心这些事情。那么,我们 如何解决这个普遍存在的数据管理难题,赋能创新,从而改变我们的 生活、工作、通勤方式,保护我们的地球呢? 如果我们在突破极限的同时能够把握住机会,实现最大价值,那么创新 是否契合最新发展趋势还重要吗?趋势可能会吸引我们的注意力,但如 果最初的兴奋并没有转化为对企业和人类的价值,那么这样的创新就 没有任何意义。 要解决这个普遍存在的问题,我们需要凝心聚力,和力共生。” DAVE MOSLEY 希捷科技首席执行官 数据新视界:从边缘到云,激活更多业务数据 | 10 | 深入研究 IDC 的另一项研究“全球数据圈” 1 揭示了为什么企业会面临如此迅猛 的 数据增长。 2015-2025 年,新创建数据的 复合年均增长率约为 26%。 2025 年,新创建的数据总量将 高达 175.8ZB(2015 年为 18.2ZB)。 2025 年,企业存储数据总量将 达 9ZB,而 2015 年为 0.8ZB。 “数据新视界”调研验证了这个 趋势:受访者一致表示,他们 获取和存储的企业数据都在不断 扩张。主要有三个要素在影响 他们存储数据的增长:数据分析 的使用不断增加、物联网设备 逐渐普及和云迁移活动。 通过“全球存储圈” 2 和“全球 数据圈”研究,我们可以更好地 了解数据的扩张。 “全球数据圈”研究表明, 2015 年的新数据中,65% 在 终端创建,其余 35% 在核心和 边缘创建。 2025 年,44% 的数据将在核心 和边缘创建,其驱动因素包括 分析、人工智能和深度学习, 越来越多的物联网设备向企业 边缘输送数据。 数据同时向核心和边缘转移:到 2025 年,全球将近 80% 的数据 将存储于核心和边缘,较 2015 年 的 35% 有大幅度攀升。 IDC 预测,到 2025 年,总安装 容量(HDD、闪存、磁带、光盘) 中的 12.6ZB 将由企业管理,而 其中的 51% 将通过云服务提供 商管理。 终端 - 创建 终端 - 存储 边缘 - 创建 边缘 - 存储 核心 - 创建 核心 - 存储 80% 70% 60% 50% 40% 30% 20% 10% 0% 20112010 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023 2024 2025 数据在哪里被创建与存储图 3 IDC 数据 1 数据时代 2025 ,希捷赞助,数据源于 IDC“ 全球数据圈 ” , 2020 年 5 月 2 “ 全球存储圈 ” , IDC, 2020 年 数据来源:数据时代 2025,希捷科技赞助,数据源于 IDC“全球数据圈”和“存储圈”, 2020 年 5 月 数据新视界:从边缘到云,激活更多业务数据 | 11 | 边缘无处不在,随处可见,包括: 生产企业车间 建筑物楼顶 户外手机基站 农场的粮仓 自动驾驶汽车 油气田的作业平台 边缘是一个位置,而不是一个物体。 它是网络的外围边界:有时可能距 最近的企业或云数据中心有数百或 数千英里,但却尽可能靠近数据 源。边缘是进行实时决策的地方。 边缘是什么? 越来越多的数据需要在边缘进行 分析和处理。 技术和经济手段的独特结合使我们 能够在边缘汇集、存储和处理更多 的数据。 下列四种技术驱动着数据的重心向 边缘转移: 1. 人工智能变得经济实用。 2. 部署的物联网设备多达 数十亿台。 3. 无线运营商将网络升级至 第五代蜂窝移动通信技术 (5G)。 4. 边缘数据中心的创新解决了 分布式设施的复杂性和单位 成本问题。 除了这些技术之外,还有一些重 要因素也推动着边缘计算的需求: 延迟、海量数据造成带宽不足、 成本,以及数据主权和合规性。 由于海量数据是在传统的数据中心 之外创建,因此云将延伸至边缘。 未来不是云与边缘的对抗,而是 云和边缘的共生。 在边缘赋予数据优势 希捷观点 数据新视界:从边缘到云,激活更多业务数据 | 12 | 边缘存储数据的增速比核心存储数 据的增速快。 边缘存储数据的增速比核心存储 数据的增速快。本次调研发现, 平均而言,企业定期从边缘向核心 传输的数据约占 36%。 两年后, 这一比例将增至 57%。 同时,立即 从边缘传输到核心的数据将从 8% 增长到 16%。为适应这种增长, 数据管理必须支持更重要的数据 流动从终端到边缘,再到公 有云、私有云或者行业云。 这对企业来说意味着什么? 这意味着数据扩张的范围更大, 企业的数据管理责任也更重。数据 扩张会造成数据孤岛,需要数据的 人无法进行访问。若没有自动化 方法,管理数据扩张则需要大量的 人力,同时需要购买很多的工具。 越来越多的存储设备将要求兼具 计算能力,否则最终还是要提供 计算功能。 边缘将要求能够存储关键数据并 进行分析,以应对终端交易和服务 聚焦:边缘数据 IDC 分析 定期传输到核心 2020 立即传输到核心 混合模式 2022 在边缘采集和存储 2022 2020 2022 2020 2022 2020 2022 2020 14% 8% 38% 15% 36% 57% 8% 16% 现在和两年后在边缘采集数据的方法对比图 4 数据来源:希捷数据新视界调研报告, IDC, 2020 年 的时延敏感型请求。与此同时, 边缘将使分布式计算成为可能, 从而对数据流进行分析。 直到服务器完成数据分析前,数据 流都有可能缓存在存储介质中。 这样一来,边缘的数据存储和缓存 之间的界限有可能变模糊,特别是 人们预期,在将相关数据迁移至 核心之前,数据仅存储很短时间 就要进行分析或处理。 数据新视界:从边缘到云,激活更多业务数据 | 13 | 第 2 章 优秀的企业明白,他们处理数据的 方式将直接转化为业务的增长。 对于与数据打交道的企业而言, 例如:云提供商、智能设备制造商、 医院、流媒体网络、连锁商店等等, 数据意味着他们投资来采集、分析 数据并将其存储于不同位置。 人们对于数据的使用越多, 从中收益就越多。 数据圈是不断丰富的人类智慧的万花筒, 涵盖生命攸关的紧急信息、历史知识、 操作说明、制造流程、情感纪事等等。 数据的确是一座价值宝藏。 数据宝藏 希捷观点 数据新视界:从边缘到云,激活更多业务数据 | 14 | 数据流失 “数据新视界”调研发现,很多组织 表示,它们的许多业务数据没有被 使用或激活。尽管数据具备价值, 但这个价值却常常流失掉。 受访者估判,他们的企业仅采集了 56% 的可用数据,也就是说, 几乎一半的数据流失掉了。 而在这 56% 的捕获数据中,企业 也只是利用了其中的 57%。 被获取的数据中,43% 没有得到 利用。 这意味着只有 32% 的企业数据 被激活,而高达 68% 的企业数据 没有得到利用。 的采集数据 被利用 57% 43% 的数据 未被采集 44% 的数据 在运营中被采集 56% 的采集数据 未被利用 实际有多少数据被激活? 图 5 IDC数据 资料来源:希捷数据新视界调研, IDC, 2020 年 数据新视界:从边缘到云,激活更多业务数据 | 15 | 总体而言,对于许多企业来说, 即使数据越来越多地被用于开发 新的运营收入,改善客户体验和 提高运营效率,数据仍然是一种被 低估的无形资产,不会体现在资产 负债表里。简言之,虽然财务报告 里没有体现,但是数据的确可以 提升企业价值。 然而,要实现数据价值,首先必须 激活数据。本次调研发现,只有 32% 的企业可用数据被激活。 激活数据并释放其价值,首先需要 有一种方法来评估数据本身的 价值。IDC 在 2018 1 年由希捷主导 的一项调研发现,全球只有 25% 的 企业为员工提供了主动量化企业 数据价值的系统和流程,至少在 某些情况下是如此。 企业有很多机会可以更好地利用 数据,获得竞争优势。上述调研还 发现,只有 11% 的企业认为自己在 挖掘企业数据价值方面优于同行, 处于行业领先地位。在医疗和运输 行业,这一比例甚至更低,只有 不到 10% 的企业认为自己是行业 领导者。 有一点可以肯定:企业希望拥有 一个充满活力的数据湖,不断吸收 新的数据,同时把旧数据、过时的 数据的价值 IDC 分析 1 全球“ DATCON”调研和“ VOB”调研, IDC, 2018 年 9 月 数据转移到低成本的存储设备上。 没有企业希望自己的数据湖变成 一个数据沼泽,让可能有用但未 被利用的数据在存储设备上沉睡。 对于任何企业来说,数据的价值都 涉及到许多变量,包括:创建数据 的行业、数据的用途、数据最终 是否得到利用以及如何利用。 以医院为例,医院创建和管理的各 类数据包括:患者信息、预约信息、 保险和账单、核磁共振 (MRI)、癌症 治疗、运营和财务数据,以及广告 数据。法规要求医院在患者死亡后 还要将这些数据保存数年时间(属 于休眠数据,未来可能被激活)。 每个数据集的价值都有所不同, 涉及隐私和合规要求的属于需要 高度保护的数据。未来,由于各种 原因,我们还需要记录和保存远程 诊疗的视频内容、外科医生的手术 动作,甚至机器人手术过程 这些数据有的也许只是为了满足 教学需求或法律要求。我们真的 能够给这些数据设定一个价值吗? IDC 尚未完全量化全球数据圈的 价值。不过,在对某医院(员工人数 为 1000-2500、营收超过 10 亿 美元)创建的数据价值做出一般性 假设之后, IDC 认为,该医院创建的 数据价 值可能接近数亿美元。 数据新视界:从边缘到云,激活更多业务数据 | 16 | 每一家企业都是数据企业,但如果不加以利用,那么这些企业数据 就无法体现价值。为了更好地理解数据,我们可以把数据湖视为 奔腾的数据之河汇集的数据水库,那么我们的任务是整合汇入的 数据之流。为此,我们有必要与其它数据湖共享数据,以便对迥然 不同的数据流进行交叉参考和分析。 以智能驾驶为例。首先,分析一家公司、一辆汽车的数据是有 价值的。然后,将该辆汽车的数据与所有智能驾驶汽车公司的其它 数据进行交叉分析,可以获得另一层面的洞察。若要获得更深层次 认识,可以扩大范围,将源于该辆汽车的数据与构成智慧城市的 数十亿传感器提供的数据进行整合。这样可以获得比较完整的 认知,从而帮助地方政府和城市规划者提升公共安全标准,并改善 交通管理。 整合的数据越多,解决的问题就越大。如果我们共享数据,交叉 参考各种信息流进行分析,那么我们就能够解决更为高阶的问题。 正因为如此,实现数据流动非常重要。数据流动起来才能互连, 才能提供洞察。” RAVI NAIK 希捷科技高级副总裁兼首席信息官 数据新视界:从边缘到云,激活更多业务数据 | 17 | 企业必须能够采集正确的数据,进而 予以识别,存储在需要的地方,并以 适当的方式提供给决策者。 激活数据,或者说发挥数据的作用, 必须从采集数据开始。物联网应用 的发展带来数据的指数级增长, 企业当前无法采集所有可用的数据, 否则 IT 基础设施负担将会过重, 并有可能发生不必要的成本。没有 可靠的数据管理解决方案,企业需要 利用数据提取软件在数据生命周期 的最初阶段就进行识别和分类。 经过适当的数据识别和分类,应用 自动化策略在数据有用的周期进行 保留,在不再需要时对数据进行 删除或将其存档。这种数据管理 方式能够降低成本,同时理顺数据 管理工作。但是,随着数据管理 解决方案技术的演进,企业可以 考虑采集更多的数据用于优化人工 智能或者机器学习。 然后,采集的数据进入数据分析环 节。通常来说,这个环节在数据湖 完成,在这里,我们利用专业的数据 分析软件基于行业或其他标准对数 据进行评估。数据管理员和科学家 利用这些工具从数据中挖掘信息, 并提供给决策者。数据汇聚于数据 湖可以消除数据孤岛,还可以将看 似无关的数据元素联系起来,从而 打造竞争优势。 存储是企业数据策略不可或缺的 一部分,它在信息分类和分析过程中 发挥着积极作用。我们必须准确、 实时地报告存储的数据,改善工作 流程、提升安全和完善资源管理。 这些将持续驱动先进的数据管理和 分析解决方案。 激活数据 “无论是结构化、半结构 化还是非结构化数据, 无论是人还是机器采集的 数据,无论数据存储在 数据中心还是云端, 它们都是打造竞争优势 的新基础。” 在边缘 边缘设备对数据采集提出了特殊的挑战。通常,只有边缘应用才知道需要采集什么数据,需要对数据进行什么 操作,哪些数据可以暂时忽略,因此很多决策工作必须在靠近数据创建的位置进行。但是新型的集中式数据管理 提取应用可以利用人工智能 (AI) 和机器学习 (ML) 对上述情况做出判断。这些程序通常可以识别敏感数据(例如: 个人身份信息、个人健康信息、信用卡号等等),并自动屏蔽以防未经授权的人员查看,从而降低数据侵权或 意外泄露的几率。 IDC 分析 PHIL GOODWIN IDC 研究总监 数据新视界:从边缘到云,激活更多业务数据 | 18 | 存储创新与数据价值 数据的存储方式和位置对企业从数据 中获取价值至关重要。下列领域的 存储创新会直接影响数据价值。 1. 大容量有助于实现规模效益。 数据分析功能随着访问数据集的 增长而改进。完善的数据管理 确保任何新的人工智能 (AI) 或机器 学习 (ML) 突破都可以尽可能多得 在物理层面访问所有数据。正因为 如此,希捷等数据存储公司一直 致力于提升面密度,以便设备 能够在相应的装置上存储更多 数据。 面密度创新主要针对全球大规模 云数据中心的数据。企业数据分布 大体上遵循 90/10 原则:90% 的 数据存储于 HDD,而 10% 的数据 存储于 SSD。 2. 存储创新的另一个重点是提供更高 的带宽,以促进存储、网络和计算 功能之间的数据流动。这对于数据 分析非常重要。目前数据分析的 支柱是 GPU(图形处理单元), 它需要高带宽来获取信息。举例 来说,企业可以在大型AI应用中 使用可组合分解架构,从而提高 带宽。 3. 另一个创新领域是安全。在设备的 完整性方面,通过对开放式安全 区不断投资,使固件和计算能够 承载、容纳适当的协议,以便对 设备进行数字验证。系统解决方案 可从组件和设备级别的安全中 获益。网络安全从系统安全中 受益。最终,因为有了更安全的 网络,计算也会变得更安全。 4. 从长远来看,数据流动架构需要 在适当的场景下,通过存储系统 来完成硬件加速或硬件卸载。 具体来说,数据集的压缩、加密 和排重目前是通过计算来完成的。 因此,大型架构必须进行扩展, 因为这些任务将在更高层面上 完成。如果通过创新,将硬件加速 和卸载推进到存储或网络层, 就不必通过计算层了。 希捷观点 数据新视界:从边缘到云,激活更多业务数据 | 19 | 第 3 章 企业通常难以访问其存放在公有云 中的某些数据,他们也很难将数据 转移出公有云,更不用说数据检索 产生的费用了。这让他们很难从 公有云中的数据获取最大价值 因为要想有价值,数据就必须流动 起来。因此,企业越来越多地采用 混合存储方案,通过多云生态系统 来管理数据。 多云架构意味着不仅使用一个公有 云,还可能使用私有云。所有架构 间通过数据管理予以协调统一。 实际上,多云架构意味着企业在 公有云中存储一部分数据,同时也 在自建私有云中存储一部分数据。 通过将部分数据回撤到私有云, 企业可以从私有云和多云生态系统 中获得极大利益。 1. 可预测的规模效益,企业更加可控。 2. 拥有 IP 所有权,能够保护数据,并控制数据的物理存储位置。例如, 当需要对数据进行审计跟踪或者要求数据必须合规时,这一点非常重要。 3. 可以频繁访问大型数据集。私有云在这方面非常有优势,当企业需要 频繁读取和分析数据时,存储费用将会迅速攀升。 4. 敏感数据集合规性。 例如,性命攸关的数据需要某医疗机构和患者的 所在位置,以及满足诸如 HIPAA 和 GDPR 等法律法规要求。 公有云催生了无数企业的成长。但是, 当企业发展到一定规模时,他们发现 仅使用公有云,就会缺乏一定的灵活性。 多云架构 私有云具有下列优势: 希捷观点 数据新视界:从边缘到云,激活更多业务数据 | 20 | 1. 快速增长和规模化。在多云生态下,团队可以在通用环境中构建和部署 应用或服务,无需在全球范围内进行投入 CapEx 即可获得新的收入 来源。 2. 获得更多服务选择,包括应用、计算和监控资源。多云架构能够激发 高性能计算,而在大多数私有云架构下获得这项能力的费用是无法 承受的。GPU 的价格高达 50-500 万美元。使用公有云意味着企业可以 租用资源来解决自己的问题,并且不会让它们闲置。使用公有云计算还 意味着企业可以获得最强的计算能力,从而提高效率并避免资源浪费。 扩展到多云生态系统后,公有云具有以下优势: 混合云可以无缝融合私有云和公有 云资源,提供综合性 IaaS(基础 设施即服务)。混合化可以确保云 之间的互通和互操作,并有助于跨 资源工作。混合云是什么形式呢? 举例来说,一家公司购买了 OEM 企业服务,将其置于共享建筑物的 托管环境中,并在后端连接到云 服务提供商协议。 混合云往往位于一个软件管理门 户下,由该门户承担繁重的连接 工作;应用知道如何与主软件层 进行对话。 在多云架构下,应用往往以云原生 的方式构建,它知道如何调用和 管理资源。混合云通常必须弄清楚 如何利用传统系统,并将它们与 公有云的优势联系起来。 数据新视界:从边缘到云,激活更多业务数据 | 21 | 50% 公有云 51% 企业私有云 36% 托管私有云 37% 多云 37% 混合云 17%行业云 1% 其他 IDC 分析师将多云描述为“一种 设计复杂、数字化服务的企业策略 或架构方法,涉及从多个云服务 提供商那里消费云服务。”多云 可能包含存在竞争关系的云服务, 例如:来自于多个公有云服务商的 公共对象存储,或者来自于一个或 多个云服务商的 IaaS(基础设施 即服务)和 SaaS(软件即服务)。 IDC 认为,在这两种情况下,多云 所包含的范围比混合云要大得多, 并且限制它的只有统一管理和治理 各种不同云方案的成本和复杂性。 将多云架构作为企业战略 企业 IT 基础设施使用了哪类云服务?图 6 管理多个云中的数据 受访者提出了各种各样的云部署 情况,包括使用多个云服务商: 研究显示,多云和混合云的采用 率相等(均为 37%)。 混合云的使用通常由应用驱动。 多云的使用随时间有机发展, 不同业务部门采购不同云提供商 的服务来满足特定的工作需求。 使用多云的企业表示,他们并 不一定有长期的整合计划。 多云和混合云环境解决了许多 不同的问题。它们让数据访问和 分析变得更加简便,降低了成本, 为管理员提供了更好的控制能力, 并提高了数据安全性。 但是,在数据管理方面,多云和 混合云生态系统也带来了一些 挑战。 IDC 数据 IDC 分析 资料来源:希捷数据新视界调研, IDC, 2020 年 数据新视界:从边缘到云,激活更多业务数据 | 22 | 在多云环境中管理数据将是受访 者未来两年面临的最大数据管理 挑战。 受访者认为,在混合云中管理 数据,是次重要的数据管理难题。 重点 “多云部署越来越难以协调和统一管理,因为 每个云平台原生的基础设施工具通常都是为了 在这个特定的平台范围内运行。此外,由公有云 提供商提供的相关数据管理或分析服务也通常是 为了与该公有云基础设施一起运行,并且可能 无法整合或在其他公有云平台上提供完整的 功能。” 在多云环境中管理数据 25% 36% 25% 13% 在混合云环境中管理数据 24% 33% 28% 14% 管理边缘和核心环境之间的数据连接 22% 34% 30% 13% 决定在什么环境(云、自建、边缘等)中 存放什么数据 22% 34% 29% 14% 赢 得 支 持 ,获 取 资 源 ,以 成 功 管 理 企业数据中心之外的数据 21% 34% 30% 14% 构建或寻求必要的专业技术知识, 以成功管理企业数据中心之外的数据 22% 34% 30% 13% 具有挑战性极具挑战性 稍有挑战性 毫无挑战 未来两年在多种云中管理数据图 7 IDC 数据 资料来源:希捷数据新视界调研, IDC, 2020 年 ANDREW SMITH IDC 研究经理 数据新视界:从边缘到云,激活更多业务数据 | 23 | IDC 的 IaaSView 研究 1 发现,多云 最常见的用例是一个公有云 IaaS 上 的应用与另一公有云 IaaS 上的应用 定期进行交互。这种安排从应用层 面来说是可行的,但是在数据管理 层面,则存在着严峻挑战: 深入研究 公有云 IaaS 上的应用与其他公有云 IaaS 上的应用定期进行交互 公有云 IaaS 上的应用与专用基础 设施上的应用定期进行交互 应用从公有云 IaaS 迁移和/ 或至其他公有云 IaaS 拥有一套配置、管理和监控工具, 可跨所有提供商使用 拥有跨大多数提供商的 类似配置和批准流程 相互独立,针对每一个提供商有不同的 团队、配置、批准、管理和应用 48% 46% 26% 25% 21% 15% 多家公有云 IaaS 提供商的整合水平图 8 IDC 分析 资料来源: 2019 年 IaaSView 调研, IDC 1 “ IaaSView 调研” , IDC, 2019 年 独立的工作流程 迥异的管理工具 缺乏统一的安全管理 难以在多个云提供商间 共享和移动大量数据 这些挑战使得哪怕最简单的数据 任务也变得复杂和耗时,例如: 在多云环境中创建可视化数据表格 和相关报告。 数据新视界:从边缘到云,激活更多业务数据 | 24 | 第 4 章 到目前为止,本报告已经确定: 业务数据蕴含大量价值。 大部分价值尚未被开发,导致 企业所有者错失了潜在收入。 从数据中获取最大价值的障碍是 企业没有采集太多数据。 但是,数据管理存在挑战还有其他 原因,而这些原因正是多云生态 系统固有的问题。本章将对这些 挑战进行说明。 数据管理挑战和 多云生态系统 管理数据 本次调研发现,在管理数据这个最 具价值的资源方面,企业表示单靠 自己无法驾驭日益复杂的数据管理 难题。在数据管理这个问题上, 他们需要帮助。 一个关键原因是:数据广泛且相对 均匀地分布于边缘和云端。但也 存在一些特例:交通和电动汽车 行业的大部分数据位于边缘,而 制造业则将较多的数据存储于内部 管理的数据中心。 IDC 数据 内部管理的 企业数据中心 第三方管理的 企业数据中心 2020 30% 其他位置 9% 20% 云端 22% 边缘数据中心 或数据集中存储的远程位置 19% (公共云、私有云、行业云) 数据当前存储的位置图 9 希捷观点 资料来源:希捷数据新视界调研, IDC, 2020 年 数据新视界:从边缘到云,激活更多业务数据 | 25 | 当被问及促使企业改变管理中央 存储需求的最重要因素是什么时: 17% 的受访者认为是提高数据 安全 14% 的受访者认为是方便获取 数据分析和管理服务(人工智能/ 机器学习、物联网等) 14% 的受访者认为是提高 IT 基础 设施运营的可视性和可管理性 11% 的受访者认为是降低基础 设施的成本/总体拥有成本 10% 的受访者认为是便于应用和 业务部门更快地访问数据 第三方管理的企业数据中心 内部管理的企业数据中心 2020 2022 边缘数据中心 或数据集中存储的远程位置 云端 其他位置 2022 2020 2022 2020 2022 2020 2022 2020 2022 2020 9% 8% 22% 25% 19% 19% 30% 28% 20% 20% ( 公 共 云 、私 有 云 、行 业 云 ) 现在和两年后的数据存储位置对比图 10 推动数据管理变革 提高数据安全 17% 14% 14% 11% 10% 9% 9% 8% 8% 提高 IT 基础设施运营的 可视性和可管理性 降低基础设施的成本/ 总体拥有成本 便于应用和业务部门 更快地访问数据 满足数据容量需求的增长 提升易用性 提高可用性和正常运行时间 整合第三方服务以配合 现代基础设施使用 方便获取数据分析和管理服务 (人工智能/机器学习、物联网等) 推动数据存储方式变革的因素图 11 资料来源:希捷数据新视界调研, IDC, 2020 年 资料来源:希捷数据新视界调研, IDC, 2020 年 数据新视界:从边缘到云,激活更多业务数据 | 26 | 企业主在采取措施更好地管理数据 之前,必须先了解自己的数据。 遗憾的是,大多数企业往往只是 收集数据,然后悉数抛进大型 存储库。 但当他们仅仅大量收集数据时, 他们将很难理解数据。而如果 不了解自己公司的数据,他们就 不知道需要收集什么数据,以及 从中获取哪些智能信息。 企业领导者的首要任务就是明确 他们为什么要收集数据,以及他们 期待获得哪些洞察。只有弄清楚了 这些,他们才会有明确的目标, 而不是一股脑全都收集下来。 收集数据很容易,获取数据智能 却很难。 要想聪明地收集和分类数据,企业 就必须解决好各种挑战,例如: 重合工具,数据复杂性,数据整合, 确保数据“干净”,确保适当的 数据相关性等等。 收集数据的工作必须围绕企业目标 (企业主希望了解什么信息)开展。 这一点必须搞清楚,否则积累再多 的数据也无法提供预期的价值。 以制造业为例。许多企业引入了 大量物联网设备和平台、带有传感 器 的终端设备,以及机器学习和 人工智能,以管理其制造生态 系统。数据收集的规模空前庞大。 企业主可以收集大量数据。但是 如果不了解自己想要从中获取 什么,就很难实现基本的目标。 举例来说,如果工厂充斥着成千 上万的物联网设备,而这些部署在 不同平台上的设备并没有得到协调 统一,那么工厂最终也难以提高 生产能力。 企业主,不要只是积累数据 成功实现数据管理的另一个手段是 采用智能数据存储解决方案。 数据管理挑战源于各种因素的 影响: 非标准架构 不同存储技术的普及与共存 管理存储技术路线存在各种困难 存储数据的管理缺乏可视性, 缺乏单一管理平台(对象存储和 文件存储显然不同) 决定哪些数据存放在哪里 高昂成本在选择存储解决方案的 决策中有一定的影响 无法将自建数据中心和云整体 作为多云存储池 应对这些数据存储管理挑战的关键 解决方案涉及到企业主如何访问 存储的数据。该解决方案的目的 就是通过单一管理平台查看所有 数据。它超越数据民主化,进入 存储统一化的范畴。首席信息官 应该能够顺利查看多云生态系统。 数据存储,通过单一平台进行管理 希捷观点 数据新视界:从边缘到云,激活更多业务数据 | 27 | 这一挑战因数据迁移至多云生态 系统而完整地呈现出来,而它的 解决方式是将数据存储于云端, 并允许企业对自己的数据进行控制 (内部、私有云或不将数据锁定的 罕见公共云)。 另一个即将出现的解决方案是目前 很多企业正在为之努力创新的存储 虚拟化。在存储虚拟化场景中, 数据存储管理软件层将会成为单一 管理平台。 企业主的底线是拥有数据的所有权, 无阻碍地、便捷地访问数据,清晰 透明、洞若观火。 数据管理挑战 企业面临着五大关键挑战,他们 认为,正是这些挑战导致他们 无法充分利用自己采集的数据: 1. 使采集的数据变得可用 2. 管理采集数据的存储 3. 确保所需数据均被采集 4. 确保采集数据的安全 5. 使各个孤立的已采集 数据变得可用 IDC 数据 这些因素虽以 IT 语言表达,但实际 上它们对于企业主非常重要,因为 它们直接影响到企业能够发掘的 数据价值,从而影响到收入(见 第 6 章)。现代数据管理解决方案 应着重解决这些挑战,以便为企业 主和客户提供最有效的体验,同时 帮助企业降低无法利用的数据所占 的比例。 39% 37% 36% 35% 30% 28% 26% 25% 22% 7% 使收集采集的数据变得可用 管理采集数据的存储 确保所需数据均被采集 确保采集数据的安全 使各个孤立的被采集 数据变得可用 获取所需资源以 管理采集的数据 掌握相关技术分析数据 建立数据管理体系和流程 创建分析数据所需的人才库 将整理的数据与数据 用户联系起来 激活数据的障碍图 12 资料来源:希捷数据新视