光交叉互联器件在数据中心的应用.pdf
版权声明 本 研究报告 版权属于中国通信标准化协会,并受法律保护。转载、摘编或利用其它方式使用本 研究报告 文字或者观点的,应注明“来源:中国通信标准化协会”。违反上述声明者,本协会将追究其相关法律责任。 研究报告要点 本研究报告对光交叉互联技术以及光交叉互联在数据中心的应用进行了研究,内容包括: 数据中心架构; 光交叉互联技术; 光交叉互联在数据中心应用的典型方案。 (传送网与接入网技术工作委员会光器件工作组) 研究单位: 烽火科技集团有限公司、中国信息通信研究院、中兴通讯股份有限公司、江苏通鼎宽带有限公司。 项目负责人: 周日凯、曹丽、何万晖。 项目参加人: 赵文玉、武成宾、许助勇。 完成日期: 2017 年 6 月 23 日 目 录 1 引言 . 1 2 数 据中心架构 . 2 3 光交叉互联技术 . 3 3.1 光交叉互联( OCS) . 3 3.2 商用技术方案 . 4 3.2.1 基于 MEMS 的光交叉技术 . 4 3.2.2 基于光束导向的光交叉技术 . 5 3.2.3 基于锁存式光耦合的光交叉技术 . 6 3.3 待成熟技术方案 . 7 3.3.1 基于可调波长转换器和阵列波导光栅的光交叉技术 . 7 3.3.2 基于半导体光放大器门阵列的光交叉技术 . 9 3.3.3 基于微环的光交叉技术 . 9 3.4 小结 . 11 4 光交叉互联在数据中心应用的典型方案 . 12 4.1 混合式架构 . 12 4.1.1 C-through 网络架构 . 12 4.1.2 Helios 网络架构 . 13 4.1.3 Enhanced Hybrid Fat Tree 网络架构 . 13 4.1.4 Vpod 网络架构 . 14 4.2 集中式架构 . 15 4.2.1 基于空分交换的集中式交换构架 . 16 4.2.2 基于波长交换的集中式交换架构 . 16 4.3 小结 . 17 5 总结 . 18 1 光交叉互联器件在数据中心的应用 1 引言 移动互联网、视频业务以及云计算的发展为数据中心带来爆发式增长的数据流量,数据中心电交换设备的交换速率和接口速率不断提高,但是依然无法应付海量数据交换的需求。网络拥塞和设备利用率不平衡的现象并存,导致数据中心运营商要不断部署设备,层层叠加的设备导致时延的增加也降低了交换的效率,并且大量部署电交换设备带来大量的电力消耗,从而增加了数据中心的运营成本。 为了寻求一种更经济有效的解决办法, 数据中心 架构师们正致力于改变数据中心的交换架构,包括采用光交叉互联设备来提高交换的效率以及用光交叉设备来应对数据中心内的大象级的数据流等。 这些设计旨在提高网络的可扩展性的同时节约了成本和功耗。虽然这些架构方法采取多种形式,但几乎所有都要求增加光交叉互联设备以创立更动态的光纤连接以及处理剧增的数据速率。 本研究报告的主要内容包括: 数据中心架构; 光交叉互联技术; 光交叉互联在数据中心应用的典型方案。 2 2 数据中心架构 数据中心是一个对数据信息实现集中式处理,存储,管理和传输的综合性平台。从服务对象和应用范围来看,传统的数据中心架构包括以 IT 支撑为主的企业数据中心和以 Web 服务为主的互联网数据中心。传统的数据中心架构如图 1 所示: 图 1 传统数据中心网络架构 1 传统的数据中心 1在设计上的不利之处有以下几点: 从拓扑方面考虑,传统树形拓扑的根节点位置会汇聚大量数据流,因此根节点处的通信链路负载极重,往往会成为制约整个网络通信的瓶颈。同时在数据中心,考虑到成本的因素,在边缘层往往会安 排多个服务器通过一个交换端口连接到上层交换机,我们将之称为过载( oversubscription),到达高层节点后,核心交换机处的过载会更加严重。例如:假设在机架内,服务器之间使用 1:1 的过载通信,也就是说,任意服务器之间以 1Gbps 的速率通信,而上行链路的速率通常只有 1 到 4Gbps,此时, TOR 交换机之间的过载达到 1:5 或 1:20,数据流继续向上,到达核心交换机处,此时,过载的情况会更加严重(可能高达 1:240)。这进一步限制了通信的流量。因此,整个网络的服务器资源会由于通信网络频繁发生的阻塞和热点不能得到充分的利用。 3 从可扩展性方面考虑,传统的网络架构只能够采用 scale-up 的模式进行扩展,即通过更新交换设备的方式来满足网络扩展的需要,这种会带来极大的成本开销。同时,由于核心层设备的交换容量会限制边缘层设备的接入带宽,网络实际上无法实现任意规模的扩展。 从资源的完整性方面考虑,由于传统网络架构将服务器划分为不同的 VLAN,而不同VLAN 将配置不同的 IP 地址空间,因此数据中心的整体资源实际上被划分在不同的 2 层域内。由于跨越 2 层域的服务部署需要在不同的 VLAN 之间引入隧道。一般而 言,管理人员会将特定应用集中部署在单一的 2 层域,这极大地减小了某种应用所能够使用的资源数量和范围。 从路径多样性方面考虑,传统数据中心一般需要考虑冗余备份,因此在源节点和目的节点之间存在多条并行路径。但考虑到若汇聚层交换机或者接入层交换机出现故障时,网络必须存在足够的冗余资源承担故障节点的负载,网络中所有设备和链路只能以最大利用率的 50%工作,因此传统网络中实际上不存在路径的多样性或者说不能够充分利用路径的多样性。 近年来,随着纳米光技术的发展和光集成工艺的成熟,光互联技术得到了较为广泛的应用和发展。 因此,光互联网络架构具有潜在的优势解决传统电互联领域的一些问题,诸如:线路带宽不足、网络能耗过高、网络架构复杂等。 3 光交叉互联技术 3.1 光交叉互联( OCS) 光交叉连接( Optical Cross Switch),是用基本的光开关技术构成光交换矩阵,实现 N个输出到 N 个输出端口的映射。 N 个 输 入 端 口光 交 换 矩 阵N 个 输 出 端 口图 2 光交叉互联结构示意图 光交换器件是构成光交叉矩阵的核心器件。 4 3.2 商用技术方案 3.2.1 基于 MEMS 的光 交叉技术 MEMS(Micro-Electro Mechanical Systems)是目前商用全光交换结构中的常见技术 2,目前 calient、 Glimmerglass 公司的全光交换机以及 crossfiber 公司的产品主要采用这一技术。MEMS 的基本思想是通过一系列镜面对光信号进行反射,最终完成光信号从输入端口到输出端口的耦合。为了完成一对端口之间的信息交换,镜面需要通过机械驱动以旋转至合适的角度。 MEMS 技术主要可以分为两类, 2D MEMS 和 3D MEMS。其中, 2D MEMS 主要通过可以沿两 个轴向翻转的平面镜完成光信号的导向。但机械控制的复杂度以及对于光信号导向的精确性限制了 2D MEMS 的可扩展规模。典型的 2D MEMS 交换机能够在芯片上集成 1024 个镜面以完成 3232 端口的交换。 3D MEMS 光交换单元主要由三部分组成:输入、输出光纤阵列, MEMS 微平面镜阵列以及折叠平面镜。其中,输入输出阵列中每根光纤接有一个校准透镜,当光束入射后,受微透镜校准后照射到 MEMS 微平面镜阵列中的一个平面镜上,该镜受控倾斜,将入射光线反射到折叠平面镜上,折叠平面镜反过来又将光反射至MEMS 的另一个微 平面镜上,再由该微平面镜将光线反射至输出端口。 3D MEMS 提供了高于 2D MEMS 的可扩展性,但控制策略更为复杂,同时需要连续的控制以及校准以确保交换单元精确适应环境条件的改变,例如物理震动,热膨胀等。 ( a) 2D MEMS 技术 5 ( b) 3D MEMS 技术 图 3 MEMS 技术光开关阵列原理图 3.2.2 基于光束导向的光交叉技术 光束导向技术 ( Beam-Streering Technology) 也被称为压电或者固态驱动,该交换单元通过使用有源准直仪将光束从一系列输入端口导向输出 端口。 Polatis serries1000 以及 series 2000 系列全光交换机均采用这一技术。通常来说,可以使用多种方法引导光束,但目前最有效的方式是使用压电材料实现固态驱动效应( solid-state actuation)。在该方式中,压电材料在加压后会引起变形和位移,而移位的程度与所加载的电压有关,因此,材料的位置以及光束的角度都可以实现精确的控制。由于压电驱动具有较高的输出功率,同时在此结构中不需要使用镜面反射光束,因此,基于光束导向的交换单元插入损耗较低于 MEMS 系统。 图 4 光束 导向技术( Beam-Streering Technology)光开关阵列原理图 3 6 3.2.3 基于锁存式光耦合的光交叉技术 考虑到 MEMS 以及 beam steering 技术均不具有 “锁存 ”的功能,即上述两种光交换技术均需要不断消耗能量来维持某种特定的配置状态。基于此, FiberZone Networks 提出了锁存式光耦合技术( Latched Optical Coupling , LOC),其基本思想是通过物理的方法将一对光纤耦合在一起,其中不再使用镜面、透镜或者准直仪。 LOC 基本架构包含三层 ,上下两层分别为有源的微连接器,在控制层作用下,连接器可以沿平面的 x 方向以及 y 方向移动。中间层为无缘的连接层,主要负责完成源连接器和目的连接器的耦合以及连接状态的锁存。当 LOC 完成配置后,即使出现电源故障或者其他有源器件故障,现存的连接不会受到影响。 因此,设备的稳定性较高,同时,光信号在自由空间中传播距离较短,因此,设备的插入损耗极小。但 LOC 的配置时间远远高于 MEMS 以及 Beam-Steering 技术。 图 5 锁存式光耦合技术( Latched Optical Coupling)光开关 阵列原理图 4 相对于以太网交换机而言,商用全光交换机仅处于初步发展的阶段。同时,由于全光交换机的初始应用环境主要为核心传输网,因此这类交换机应用于大规模数据中心时主要存在以下一些技术缺陷: 交换机配置时间过长 基于 MEMS 的交换机以及基于光束导向交换机的端口配置时间均在 20ms 左右,而基于 LOC 的交换机配置时间更高达 30s。对于电信网络的核心交换机而言,稳定的大流量负载要求交换机的开关时延低于 50ms 即可。但由于云计算数据中心的流量模式极为复杂同时流量特点具有较强的突发性 5,毫秒级的开关时 延会严重影响网络性能。 插入损耗较大 光束在 MEMS 交换机内部需要经过镜面反射以及自由空间传播,因此设备的插入损耗