2.3 集群路由器技术和高速链路_通信网络智能管道架构与技术实现-QQ阅读中文科幻网

上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

2.3 集群路由器技术和高速链路

2.3.1 集群路由器技术

随着网络节点数据流量的日益增大，在核心节点中不断增加路由器数量使得网络内部网关协议（IGP）及边界网关协议（BGP）的路由设计、维护日益复杂。同时，繁多复杂的链路及路由关系，也使得流量均衡和调整变得日益困难。从投资的角度来看，核心节点内部路由器之间互连带宽应该如何设计，本身并不产生推动力的互连端口，给投资带来的浪费都是不容忽视的问题。

解决上述问题的方法有两个：一是不断增大路由器的容量和端口密度；二是采用路由集群技术。不断增加路由器的容量以及端口密度受制于当前的科技能力，包括半导体技术、多层印制线路板技术、光器件技术，以及电源和散热工艺等，高端设备的更新换代周期也会因为受上述技术制约而逐渐放缓。目前的高端路由设备均采用控制平面和数据平面分离的方式构建，同时也是路由集群技术得以实现的基础。简单地说，路由集群技术是将多台高端路由设备的数据平面通过光交换矩阵互联，同时协调统一多台设备的控制平面，使之在路由逻辑上成为一个单点，尽可能地简化路由设计和流量规划，节省设备投资。

目前，世界上实现路由器集群技术的电信设备供应商主要有：美国的Juniper、Cisco和中国的华为、上海贝尔。路由器集群技术主要采用两种方式：

● 集中式集群技术；

● 分布式集群技术。

集中式集群技术是指集群路由器控制平面是集中分布式的，即所有的路由协议、软件进程、控制转发等工作均由交换矩阵（Switching Fabric）完成。用户路由机框（路由节点，RN）主要管理本机架工作状态。转发路由通过交换矩阵集中处理，再分布式地分发到用户路由机框，然后再到转发接口卡上。

分布式集群的一个集群节点具备多级交换结构，组成集群节点的机框本身可以运行在单机模式下，也可以工作于集群（Cluster）模式。每个机框单独计算路由器协议、运行单独的软件进程。

目前实现集群路由器设备的厂家只有美国的Cisco公司、Juniper公司和中国的华为公司，但这三个厂家的集群路由器实现均采用集中式集群技术；分布式集群技术则类似当前的云计算技术，实现技术要复杂得多，目前尚在研究当中。

下面以Juniper公司的T640和Cisco公司的CRS-1为例，简要介绍集中式集群技术的原理。

1.Juniper T640集群技术

1）系统架构

Juniper TX路由器集群系统采用的是TX Matrix（矩阵）平台，可以将多台T640 RN集成，吞吐量达到每秒30×109个数据包。T640 RN可在100m外连接到TX Matrix平台上，从而实现本地及分布式部署。

TX Matrix在集群路由器中，实现中心路由和交换的功能。该平台基于完全的冗余架构，通过JUNOS（Juniper Network Operationg System）软件（如平稳路由引擎）切换，具备在线升级（ISSU，In-Service Software Upgrade）和双向转发检测（BFD，Bidirectional Forwarding Detection）等高可用性特性，可彻底消除单点故障。

Juniper的TX多机框系统架构如图2-31所示，目前可以级联4台T640，提供2.5Tb/s的流量汇聚。

图2-31 Juniper的TX集群系统架构

Juniper TX采用单头部（Single Head）结构，整个系统分两个平面：控制平面和交换矩阵转发平面。

控制平面由交换卡机框（Switch Card Chassis，SCC）和线卡机框（Line Card Chassis，LCC）的控制板（CB）、路由引擎（RE）及它们之间的连接组成，同时采用以太网技术由多个一对一线路构成，用于控制信息同步，如路由信息从SCC到LCC、机框状态信息从LCC到SCC。

控制平面主要的特点是：

● SCC上安装有连接接口面板（CIP）的接口卡，内部连接到控制板（CB），外部直接连接到LCC，无须其他外接设备支持，故障点少。

● 控制信息同步具有选择性，如在LCC的机框中的报警状态可以传上来，但软件失败生成的信息文件不会传上来，这样可以合理地减少控制信息传递数量。

● 可以在LCC和SCC的控制口同时监控，LCC监控本机框的信息，SCC监控整个系统的信息，增强了系统监控的可靠性。

● 路由表更新具备强扩展性，SCC只管理到LCC的分发，LCC再管理到每个包转发引擎（PFE）的分发，这样即使在路由振荡的情况下，仍然可以保持较高的更新速度。

交换矩阵转发平面由LCC的交换接口板（SIB），SCC的SIB及它们之间的光纤连接组成，采用三级CLOS结构（由Charles Clos提出的一种多级交换网络结构）。数据从PFE进来的LCC为第一级（Stage1，S1），SCC是第二级（Stage2，S2），输出的PFE所在的LCC是第三级（Stage3，S3），即第一级（S1）和第三级（S3）在线卡机框（LCC）上实现，第二级（S2）在交换机框（SCC）上实现。

交换矩阵平面的特点是：

● LCC到SCC的连接采用美国军用VCSEL标准，有外层保护、安全度高。

● 从LCC到SCC的光纤连接两倍于LCC的矩阵能力，同时由192根光纤连接，从而增大了矩阵的加速比，对解决头阻塞和降低延时均有很好的作用。

● SCC的光纤连接直接做到系统接口板（SIB）上，采用集成结构、减少了故障点。

● 矩阵采用CLOS结构，用多连接解决路径问题，比依赖缓存解决路径问题的Benes矩阵效果好，主要表现在时延低。

● 矩阵基本数据单位采用10Gb/s速率高速连接（HSL），简化了基础矩阵单元的设计，降低了故障率。

从整个系统看，路由是由Juniper TX集中处理，分布式分发到T640路由机框（RN，Routing Node），然后再到PFE；硬件状态从PFE传到T640 RN，再到Juniper TX；数据转发由各个T640 RN分布式完成；软件是单机JUNOS的完全平滑升级。Juniper TX系统架构有继承性，成熟度高，实现起来简单可靠。

2）交换矩阵结构

Juniper TX多机框系统采用无阻塞的三段式CLOS矩阵结构，如图2-32所示。三段式CLOS体系结构可以实现以下功能：

● 保证了多机框的大容量；

● 分布式控制可以实现高可靠性；

● 全冗余设计，支持平滑升级和回退；

● 无阻塞结构（any to any）；

● 公平带宽分配；

● 低时延；

● 容量扩展平滑；

● 实现在线板卡插拔和软件升级。

图2-32 Juniper的TX集群系统交换矩阵结构

其中，TX集群完成S2阶段的工作，S1和S3阶段的工作在T640 RN上完成。S1实现的功能是对从线路卡输入的流量进行缓存，并且把输入的数据数据单元流量平均到所有的工作正常的S2节点路径上；S2实现的功能是接收所有的从S1输入的数据单元，对其进行缓存，并根据在数据单元头描述的目的S3的出方向通道进行队列调度；S3实现的功能是接受从S2节点输入的数据数据单元，并根据数据单元头描述的目的地进行队列映射。无阻塞三段式CLOS结构的优点有：

● CLOS矩阵广泛用于解决海量输入／输出环境，技术成熟，可靠性高；

● 分布式寻址可充分利用矩阵之间的多个连接；

● 无须为各级矩阵配备很大的缓存；

● CLOS交换矩阵基本上无智能，仅仅是转发通道。转发算法的压力基本在PFE，和单机结构转发结构一致，增强了可靠性。

2.Cisco CRS-1集群技术

CRS-1建立在Cisco IOS XR软件的基础之上（Cisco IOS XR软件是Cisco IOS软件系列中的一个软件系统，旨在支持Cisco CRS-1的多CPU、多机架分布式架构。IOS XR建立在一个分布式的、基于微内核的操作系统基础设施上，从而让IOS处理器和子系统可以被分散到数千个处理资源中的任何一个），该软件系统采用Micro Kernel（由加拿大QSSL公司（QNX Software System Ltd.）开发的分布式实时操作系统）技术，将各个进程模块化，以便实现单独进程升级和维护，它适用于多机架的Tb级别电信级基础设施的自恢复式操作系统。

1）CRS-1交换结构

CRS-1的交换不是一个全交叉开关式或纵横开关式（Cross-bar）的结构，而是一个3级（Stage）Benes网络交换结构。Benes网络交换结构是CLOS网络的特例，它是通过3个参数（r，n，m）定义的一个3级交换拓扑，其3级结构分别为：输入级（Ingress Stage），中间级（Middle Stage）和输出级（Engress Stage）。图2-33所示为一个通用的CLOS网络拓扑模型。

图2-33 通用的CLOS网络拓扑模型

在图2-33中，r是输入级（Ingress Stage）部件的个数；n是每个输入部件的输入接口数目；m是每个输入部件的输出接口数目。在理解CLOS拓扑结构时，要抓住一个非常重要的概念：对于整个拓扑结构中的每个子部件，都是一个交叉开关（Cross-bar）。例如，对输入级来说，有r个n×m个交叉开关。因为它有r个输入部件，输出是m个。因此，中间阶段一定是m个部件。为了形成交叉开关，很自然是r个输入，r个输出（除非做加速）。这也就是为什么中间阶段是m个r×r个交叉开关。在最后的输出阶段（Engress Stage），系统是一个逆转过程，通过r个m×n的交叉开关完成系统最后的交换过程。

CLOS网络最大的优点是：相对一个没有中间交换过程的交叉开关（Cross-bar）结构，如果要实现一个n×n的全交换，CLOS网络所需要的连接节点数目要小得多。

Benes交换拓扑是CLOS交换拓扑的一个特例，即m=n=2。也就是说，在Benes交换拓扑中，每个输入（Ingress）和输出（Engress）子部件都是一个2×2的交叉开关。要注意的是，中间交换阶段（Middle Stage）是2个r×r的交叉开关。如果r是4，那就是2个4×4的交叉开关。如果是16，那就是2个16×16的交叉开关。图2-34所示为一个8×8的Benes交换拓扑，通过此拓扑设计，能够实现8×8出的双向无阻塞交换。

图2-34 8×8的Benes交换拓扑

CRS-1最重要的部分可以说就是其交换矩阵和拓扑。交换矩阵把CRS-1的各个组成部分有机地结合在一起，形成一个高速的路由器。CRS-1的交换是CRS-1体系结构里略微复杂和难理解的部分，下面分别对线卡机框（LCC）和交叉连接卡机框（FCC，Fabric Card Chassis）的交换矩阵和拓扑做一些概念上的解释和阐述。

首先，要了解CRS-1交换矩阵（Switch Fabric）、交换平面（Switch Plane）、交换卡（Switch Fabric Card）及其之间的关系。交换矩阵和交换平面是两个逻辑实体。交换卡属于物理实体（实现）。

CRS-1交换平面（Switch Plane）：交换平面是交换矩阵的最小单位。一个交换平面能够实现一个完整报文交换的功能。其中，每个交换平面采用三级（Stage）交换的体系结构。每个交换平面是由交换卡实现的。换言之，每个交换卡就是一个交换平面。

CRS-1交换矩阵（Switch Fabric）：交换矩阵由8个或者4个交换平面所组成。用于集群路由器的16槽LCC有8个交换平面，交换平面之间是并行的、没有依赖关系。换言之，这些交换平面的关系是正交的。

交换矩阵中通信的粒度是大小固定的数据单元（Cell）。一个数据报文（Packet）在经过交换矩阵之前，线卡的输入级模块服务卡（Ingress Module Service Card）会把该报文分解为多个数据元。模块服务卡（MSC）会决定一个数据元被发送到哪个交换平面，并通过这个交换平面到达目标输出级模块服务卡（Engress MSC），这个MSC汇总属于该报文的所有数据单元（Cell），并恢复成一个数据报文（Packet），并通过端口卡PLIM（Physical Layer Interface Module，物理层接口模块）上相应的端口（Port）把报文转发出去。一定要注意的是：属于同一个报文的不同的数据单元，是可以（其实是通常）通过不同的交换平面抵达目的线卡的数据元。但一个特定的数据单元会而且只会通过一个选定的交换平面进行转发。在CRS-1中，输入级线卡上的MSC通常是通过轮询（Round Robin）算法来决定使用哪个交换平面的。其中的原因很简单，这样做可以使这8个交换平面的负载均匀化，避免发生某一个交换平面由于产生阻塞而丢掉数据单元的情况。

2）CRS-1集群组成

CRS-1集群由线卡机框（LCC）和交叉连接卡机框（FCC）交换矩阵主要用的是switch Fabric组成，FCC是用来把多个LCC连接成集群的产品。线卡机框本身可以作为一个独立运行的核心路由器（需配置不同的板卡）；而Fabric交换机，其本身不是一个路由器，它是一个非常快速的交换设备，可以将线卡路由器连接成一个路由器群，从而可以形成和支持超大规模的数据通信。

CRS-1单线卡机框容量为1.2Tb/s，理论上一个CRS-1集群节点的最高配置为：通过8个交叉连接（Fabric）交换机，形成8个并行的高速交换平面（Switching Plane），把多达72个线卡机框连接起来，支持多达1 152个40Gb/s的线卡。因此，CRS-1的多机框互连的最大交换速率可达：1152×40Gb/s×2=92160Gb/s=92Tb/s。但8个交叉连接卡机框（FCC）连接72个线卡机框（LCC）的工程量非常巨大，除了做到要把所有的光纤正确的连接，还需要对各种板卡软件进行的初始化和数据管理等，这也许是更复杂的问题。目前，CRS-1系统软件最大配置容量可以支持8个16槽线卡机框（LCC）与1个，2个或者4个交叉连接卡机框（FCC）互连。其中，2个或者4个交叉连接卡机框（FCC）的目的是为了提高系统的容错性，例如可以通过配置把8个数据交换平面分布在2或4个FCC上。但从理论和实践上而言，一个交叉连接卡机框（FCC）的24个S2交换卡和相应的24个光缆接入卡,已经可以足够支持8个16槽线卡机框（LCC）的交叉连接卡机框（FCC）互连了。

CRS-1的物理交换卡就是基于上述结构并通过物理卡上的多个ASIC芯片实现的。CRS-1基于交叉连接卡机框（FCC）的多机互连的本质是：多个线卡机框（LCC）加上一个或者多个交叉连接卡机框（FCC）形成的一个系统，是而且只是一个路由器。其原理是：交叉连接卡机框（FCC）配置实现阶段2（Middle Stage，中间级）的交换卡，简称S2卡；LCC配置实现阶段1（Ingress Stage，输入级）和阶段3（Egress Stage，输出级）卡，简称S13卡。

FCC满配可以配备24个S2交换卡，每个S2卡上含有6个交换ASIC芯片（也即S2芯片）。用于集群路由器的LCC，配备16个S13卡，同样每个S13卡含有6个交换ASIC芯片，2个完成S1阶段，4个完成S3阶段。图2-35是FCC互连的交换矩阵和交换平面逻辑图。

图2-35 FCC互连的交换矩阵和交换平面逻辑图

在FCC互连交换中，每个LCC的8个S13交换卡，分别提供整个系统8个交换平面的S1和S3阶段，一个S13卡只属于8个交换平面中的一个。任何一个数据单元（Cell）一旦交换，不会跨越交换平面，要么成功，要么扔掉。一个数据单元通过S13卡的S1 ASIC芯片，然后通过光缆线进入FCC的光缆接口卡OIM（Optical Interface Module），接着通过FCC的中间板，进入FCC的S2卡。S2卡再将该数据单元转发给某个LCC的S13卡，继而被该S13卡上的S3 ASIC芯片接收。需要注意的是，这个用来接收的S13卡，完全可以是当初该数据单元发送时S1阶段的那个S13卡，因为任何数据都必须通过S2卡转发，不能从一个S1的ASIC芯片直接交换到同一个S13卡的S3 ASIC芯片上。

上面以两个典型集群路由器为例，简要介绍了路由器集群的技术。就设备而言，华为公司的NE5000E是国内生产的一种高性能集群路由器系统，其特性如下：

① 支持多种集群模式。NE5000E采用先进的无阻塞交换网络架构，单框端口容量双向可达1.28Tb/s，未来端口容量可从1.28Tb/s平滑扩展到80Tb/s，支持每槽位40Gb/s容量，转发能力高达1600Mb/s；多种集群模式，如背靠背集群、2+4集群、2+8集群等，最多可达16+64集群系统。

② 支持按需灵活选择。NE5000E同时支持40Gb/s白光接口和彩光接口，华为公司整合了40Gb/s IP和光缆的领先优势，支持白光/OTN（光传送网络）全场景40Gb/s方案，同时具备彩光的40Gb/s能力。

③ 电信级可靠性。NE5000E采用无源背板设计，所有关键组件支持热插拔与热备份，并且实现了基于状态的热切换和不间断的路由转发，同时提供热补丁技术及软件平滑升级；满足99.999%的电信级可靠性要求，有效保证了网络的高速可靠。

④ 绿色集群。NE5000E关键芯片设计采用65nm工艺，集成度提高，降低功耗约30%；在散热方面，采用循环风散热技术，大大提高了散热效率，降低散热功耗约50%；用于各路由器互连的光子卡（Photonic Layer Card），可根据集群路由器的框数进行灵活配置，相对固定配置的集群系统，在2拖4的集群系统中仅光子卡就节省功耗500W。华为公司的两框集群产品，每年可节省50万度电，相当于减少500吨二氧化碳的排放。这些二氧化碳，需要2个足球场大小的树林吸收一年。采用新型材质和紧凑设计，体积小、重量轻，可放置于标准的19英寸机柜中，对地面承重无特殊要求，既可快速部署，又节省了机房改造工作量。

集群路由器的关键指标主要包括：设备交换容量、单槽位线卡容量、端口密度、整机端口容量等，其可扩展性、稳定性和可维护性，需通过优秀的设计、可靠的工艺和稳定软件系统来保证。为了保证网络的正常运行以及操作维护的便捷，集群路由器的设备管理、在线升级能力、容灾能力、故障自动检测和报警等功能等也是至关重要的。

随着网络规模不断扩大的需求，以及芯片技术和工艺的发展，全球几大知名设备制造商还在推出更大容量的设备，Juniper公司提供TX Matrix Plus作为中央交换和路由设备，最多能将16个T1600机框互连为单一路由设备；Cisco的CRS-3多机框设计容量达322Tb/s。预计2012～2013年，将出现200G/槽单机产品；2013～2014年，单槽400Gb/s芯片成熟，到2015年～2016年出现产品；2020年可能出现单槽2Tb/s产品。

2.3.2 40Gb/s高速链路技术

伴随着我国宽带用户数量每年1000多万户的高速增长和以FTTx为代表的宽带接入技术的普及，我国主要运营商骨干IP网络容量和带宽需求一直保持高速增长态势，对核心路由器容量和链路速率造成了巨大压力。2.3.1节介绍的集群技术，主要用来解决核心路由器的容量瓶颈问题；而本节和2.3.3节将介绍路由器链路的高速化发展趋势和40G/100G高速链路技术的发展和应用情况。

40G POS（Packet Over SDH，基于分组的SDH）技术是最早成熟和应用的40Gb/s高速链路技术，目前已经在中国电信、中国联通等电信运营商网络中得到了大规模部署。40GE（40Gb/s以太网）是另一种已经完成标准化的40Gb/s高速链路技术，但是由于其出现时间较晚（2010年6月与100GE标准同时颁布），路由器设备厂商支持不全面，目前在电信运营商网络中尚未开始应用。因此本节以40G POS高速链路技术为主。

40G POS技术与2.5G POS，10G POS等技术一脉相承，而POS技术也是电信运营商网络中占据统治地位的路由器链路技术，因此40G POS技术引入网络应用是非常顺理成章的过程。Cisco公司等路由器设备厂商早在2005年就推出了支持40G POS链路的核心路由器和40G POS线卡。支持40G POS链路长途传输的40Gb/s光波分复用（WDM）传输技术和设备也在随后的2～3年内成熟。中国电信等运营商从2008年开始部署40G POS链路技术，目前我国40Gb/s网络规模已位居全球前列。

由于40G信号对传输性能的要求远比10Gb/s信号苛刻，同等条件下，40Gb/s信号光信噪比（OSNR）要求比10Gb/s信号高6dB，色散受限传输距离和偏振模色散（PMD）受限传输距离只有10Gb/s信号的1/16。因此，40G POS接口的传输距离远远低于10G POS接口的传输距离。目前商用40G POS接口只有一种规格，即在G.652普通单模光纤中的标称传输距离是2km，工作波长为1550nm，主要受限因素是色散容限。虽然ITU-T等国际标准化组织也制定了一些长距离的40G POS接口技术标准，但是由于技术和成本等方面的限制，目前尚未见到成熟的产品。

由于40G POS接口光纤直驱传输距离的限制，在长距离组网时需要光传输系统的支持。在2005年40G POS接口出现的最初几年，由于40Gb/s光波分复用（WDM）传输技术尚未成熟，导致其应用受到极大限制。直到2008年前后，40Gb/s WDM传输技术和设备逐渐成熟并开始规模部署，带动了40G POS高速链路技术的大规模普及。目前中国电信、中国联通等主要宽带运营商的骨干IP网络基本上已经采用了40G POS高速链路技术，因此本节将重点介绍40Gb/s WDM传输技术。

为了克服4倍速率提升带来的性能劣化，实现与10Gb/s WDM传输系统相当的传输距离和性能，40Gb/s WDM传输系统采用了一系列先进技术，其中特别值得介绍的是先进调制码型技术、前向纠错（FEC）技术和精确色散补偿技术。

1.先进调制码型技术

传统WDM系统调制码型的选择非常简单，NRZ（非归零码）码以其较低的实现成本、较窄的频谱带宽和较好的色散容限成为一种标准码型。但是，从10Gb/s WDM系统的超长距离（ULH）传输开始，NRZ码逐渐暴露出非线性容限差、对传输损伤敏感等诸多缺点。随后，各种新型调制码型争先恐后地登上舞台，进入40Gb/s时代以后，调制码型更成为一个热门话题。由于40Gb/s信号对色散、非线性、偏振模式色散（PMD）等传输损伤因素更加敏感，因此对码型的要求也更加苛刻。NRZ码已不再能够满足要求，一些新型调制码型逐渐得到人们关注，包括归零码（RZ）、载波抑制归零码（CSRZ）、差分相移键控码（DPSK）、差分正交相移键控码（DQPSK）、光双二进制码（Optical Duobinary，ODB），或者称为相位整形二进制传输码PSBT（Phase Shaped Binary Transmission），等等。

1）NRZ码和RZ码

NRZ码和RZ码都属于开关键控OOK（on-off-keying）技术，它构成了经典的强度调制-直接检测（IM-DD）光通信系统的基础，并在传统WDM系统中占据了统治地位。NRZ码用高功率表示数字码“1”，接近于零的低功率表示数字码“0”，相连的“1”码之间光功率保持高水平。NRZ码应用简单、技术成熟、成本低、频谱效率较高，在现有WDM系统上得到了最广泛的应用。传统WDM系统信号速率低，全光传输距离短，因此NRZ码的局限性并没有显露出来。但是进入超高速（40Gb/s）和超长距离（ULH）传输以后，NRZ的缺点开始显露：首先NRZ码光信号的平均功率比RZ码高，更容易受非线性失真的影响；其次NRZ码色散容限小（约为60ps/nm）。在40G WDM系统的短距离传输应用中（<600km），NRZ码还是一种可行的码型，但是对更远的传输距离，NRZ码就力不从心了。

RZ码用光脉冲的“有”和“无”表示数字码“1”和“0”，“归零”指的是相邻光脉冲之间光功率会回到零，这是RZ码与NRZ码之间最明显的区别。RZ码的归零特性增大了其频谱宽度，降低了功率密度，从而提高了非线性容限能力。此外，RZ码定时信息丰富，有利于恢复时钟，具有自同步能力，减小接收机的复杂度。RZ码的最大缺点是频谱宽度宽，更容易受色散影响。RZ码的调制方法比NRZ码复杂，常用的光调制方法采用两级调制器，分别进行时钟调制和数据调制，如图2-36所示，第一级为时钟调制，产生RZ光脉冲；第二级为数据调制，产生RZ数据码。

图2-36 RZ两级光调制示意图

虽然RZ码比NRZ码更适合长距离、高速率WDM传输，但是传统RZ码并没有得到太多的应用，而是人们以RZ码为基础，引入了相位调制技术，开发出了多种结合两种调制方式的新型调制码型，并以它们的优异性能成为40G WDM系统的主力码型。可以简单地将它们分成两类：第一类码型的相位调制不携带信号信息，辅助的相位调制只用来增强信号对传输损伤的容限，如CSRZ码、PSBT码等；第二类码型的相位调制携带信号信息，RZ强度调制只用来改善信号传输性能，例如RZ-DPSK码、RZ-DQPSK码等。

2）CSRZ码

CSRZ码是在传统RZ码的基础上，每两个相邻符号位的载波之间加入π的相位差，载波π的相位差也可以看成信号加一个负号而载波不变。这个具有正负双极性的信号，均值为零，因此其频谱零频率处无函数导致的尖峰，乘以载波以后，在载频处也没有尖峰，这就是所谓“载波抑制”之名的由来，也因此CSRZ码有优越的抑制受激布里渊散射（SBS）的性能。

CSRZ码的调制方案与图2-36所示的RZ码的调制方法类似，区别在于时钟调制器偏置和驱动电压的配置：CSRZ码时钟调制器偏置在输出光功率最小处，驱动幅度接近2Vπ（Vp-p），时钟为正弦波，频率为数据比特率的一半。

CSRZ码的频谱宽度介于NRZ和RZ码之间，40Gb/s信号谱宽大约90GHz。它保持了RZ码的传输优势，同时又改善了RZ码色散容限小等缺点，还可以比NRZ码提高1～2dB的光信噪比（OSNR）容限。此外，CSRZ码实现简单，相对于NRZ和RZ码具有更好的非线性容限和滤波鲁棒性，但由于较宽的信号光谱，主要适用于100GHz间隔的40Gb/s WDM系统。因此在我国运营商网络中没有得到规模应用。

3）ODB码和PSBT码

PSBT码和ODB码的本质都是双二进制（Duobinary）调制，基本思想是将可控的码间干扰引入信号传输，展宽信号时域波形，从而有效地压缩频域带宽，获得高频谱效率，如图2-37所示。双二进制码技术在40Gb/s WDM传输领域具有色散容限高、频谱带宽窄，在一定条件下可以有效抑制光纤非线性效应等优点。PSBT码的原理是将载波在每一个和“1”码相邻的“0”码中间变化π的相位，因此前后“1”码由于色散引起的脉冲展宽部分在“0”码中间相互抵消，能够极大地降低色散的危害，这也是所谓相位整形（Phase Shaped）名称的由来。

图2-37 双二进制码调制与接收原理图

传统双二进制调制是三电平幅度调制，但是光域三电平会导致接收机灵敏度的劣化，PSBT码通过相位调制和幅度调制相结合，实现了电域三电平，光域二电平。PSBT编码实现简单，只需将发射端电路进行一些改造（更换成一个双驱动马赫-曾德尔光电调制器（MZM）、增加一个电滤波器）即可；接收系统与原来的强度调制-直接检测IM-DD系统接收机兼容，因此成本相对较低。PSBT码频谱宽度大约是NRZ码的一半（约43GHz），具备了50GHz间隔传输的条件。虽然PSBT码可以大大提高系统的色散受限距离，但是其噪声容限却由于眼图张开度指标的恶化而明显降低，因此保持较好的光信噪比（OSNR）是PSBT码应用的重要前提。

PSBT码和ODB码由于其低廉的成本，在城域网和一些短距离骨干网上得到了一定范围的应用。

4）DPSK码和DQPSK码

相移键控技术（PSK）是在数字通信系统，尤其是微波通信系统中得到广泛应用的一种调制技术，在星座图上，PSK技术可以增加码间距离，从而提高信号传输抗干扰能力（见图2-38）。

图2-38 OOK，DPSK，DQPSK等码型星座图

差分相移键控（DPSK）码将数据承载于邻近光脉冲的差分相位上，即前后两个信号脉冲的载波相位相同则表示是数字码“1”；相反表示数字码“0”，光脉冲作为载波。DPSK码的特点是信号功率恒定，信号信息完全由相位来表现。但是，为了适应光传输系统的特点，一般在相位调制后加上强度调制，称为Carving。通常使用的DPSK码，采用RZ码Carving的DPSK码，称为RZ-DPSK。

由于DPSK采用相位调制，因此接收端需要进行相干解调，常用的方法是平衡接收机（Balanced Receiver），其主要结构是延时干涉仪（Delay Interferometer，DI），或称为非对称马赫－曾德尔干涉仪（Asymmetric Mach-Zehnder Interferometer，AMZ），它可以将相位调制转换为强度调制，在后端使用常用的强度接收机，如图2-39所示。

图2-39 DPSK码调制与接收原理图

DPSK码有以下优点：

● 非线性效应的抑制能力增强，平均功率一定时，DPSK码的峰值功率相对于RZ/CSRZ码有3dB的改善，因此对与峰值功率相关的非线性效应（如自相位调制SPM，交叉相位调制XPM，四波混频FWM）的抑制能力显著增强；

● 系统平均功率一定时，由于增大了码间距离，因此DPSK码对光信噪比OSNR的要求比RZ/CSRZ码低3dB左右。

DPSK码的缺点是噪声引起的功率起伏会通过SPM（Self—Phase Modulation，自相位调制）效应产生相位波动，该效应称为非线性相位噪声，因此在非线性受限的DPSK系统中，需要额外考虑非线性相位噪声引起的系统损耗。

DPSK码的信号光谱较宽，比较适合在100GHz间隔的WDM系统中传输。为了满足在50GHz间隔条件下传输的需要，人们对DPSK码进行了一些改进，主要体现在对接收机延时线干涉仪（Delay Line Interferometer，DLI）的调整，使其经过50GHz间隔滤波器滤波以后可以满足信号的有效接收，通过牺牲一定的系统性能，满足80×40Gb/s WDM传输的容量需求。目前这种所谓P-DPSK码（Partial DPSK，部分差分相移链控）是我国运营商现网应用的40Gb/s DPSK码的主要类型，其标称系统传输规格达到12×22dB（80km）。

差分正交相移键控调制码（DQPSK）是对DPSK码的进一步发展，它可以实现更高的频谱效率。在同等信号码率条件下，DQPSK的频谱带宽只有DPSK的一半。因此DQPSK码完全可以实现50GHz间隔的40Gb/s WDM传输。目前，我国行业技术标准定义的40Gb/s DQPSK码的系统传输规格是16×22dB，性能优于DPSK码。但是，DQPSK码相对于DPSK码更重要的技术优势是更大的偏振模色散（PMD）容限，DQPSK码的PMD容限可以达到6～8ps/nm，相对于DPSK码的2ps/nm提高了3～4倍，其PMD受限距离提高了9～16倍。这对提高40Gb/s WDM系统的网络适用范围具有非常重要的意义。

基于性能上的优势和广泛的网络实用性，使DQPSK码成为我国电信运营商目前40G WDM系统中应用最广泛的调制码型（见表2-3）。

表2-3 我国通信行业技术标准定义的常用40G码型80×40G WDM系统规格

* 采用特殊优化技术可以达到16×22dB规格，目前主要设备厂商均能满足。

2.前向纠错（FEC）技术

前向纠错（Forward Error Correction，FEC）技术是另一种促使40G WDM传输系统成熟和商用的重要使能技术（Enabling Technology）。FEC不属于物理层技术，而是通过在发射端对传输码序列加入冗余纠错码，在接收端利用这些冗余纠错码在解码过程中自动纠正传输过程中产生的部分误码。满足同样的误码率（BER）的条件下，使用FEC可以有效降低系统对光信噪比（OSNR）的要求，从而达到改善系统性能、降低系统成本、延长传输距离的目的。从等效的角度来理解，FEC的作用相当于降低了系统的OSNR容限，一般将一定接收信号误码率条件下，使用和不使用FEC时，系统的OSNR容限之间的差，定义为FEC的编码增益，用来表征FEC的性能。显然，FEC编码增益越高，说明其纠错性能越强。

FEC技术本质上是利用电子电路复杂性来换取OSNR容限的改善，常用的编解码格式有以下几种：汉明码（Hamming Code）、BCH码（Bose-Chaudhui-Hocquenghem Code）、RS码（Reed-Solomon Code）、卷积码（Convolution Code）和级联码（Concatenated Code），其中RS码在现有FEC系统中得到了最广泛的应用。

业界用于WDM传输系统的实用化的FEC技术，主要有带内FEC和带外FEC两种，其中带外FEC又根据FEC算法是否标准化，简单分为标准带外FEC和增强型FEC（EFEC）两种。

表2-4 FEC方案比较

由于40G信号对OSNR的要求非常苛刻，因此具有最高编码增益的增强型前向纠错（EFEC）技术成为当今自然的选择。由表2-4可知，EFEC编码格式具有不同的编码冗余度，主要有7%，11%，25%三种，由于40Gb/s信号自身码率已经很高，过大的编码冗余度将使传输信号的码率过高，对系统的整体性能和成本造成不利影响，因此7%编码冗余度的EFEC技术得到了最广泛的应用。

3.精确色散补偿技术

色度色散（Chromatic Dispersion，CD）（简称色散）是光通信系统的常见现象：从时域角度来看，色散使得一个光脉冲在传输过程中不断展宽，如果相邻两个光脉冲展宽程度过大，互相重合在一起，接收时就无法将它们分辨出来；从频域角度分析，色散的本质是光脉冲中不同频率的光传输速率不一样，传输相同距离产生的时延不一致。

通常情况下，色散对光纤数字传输系统的影响是使数字光脉冲被展宽（特殊情况下也可以是脉冲得到压缩）。如果没有色散补偿，光信号传输一定的距离以后，色散引起的脉冲展宽将导致码间干扰，直致无法有限检测出信号，这个距离称为色散受限距离。在数字光通信系统中，光信号的色散受限距离（LCD）一般由信号速率B（比特率）和光纤的色散系数D[ps/（nm·km）]共同决定，对于NRZ码，可以用如下经验公式进行估计（不考虑啁啾）：

可见色散受限距离与传输信号比特率的平方成反比，我们用G.652光纤、1550nm波段[D=17ps/（nm·km）]进行分析：对于2.5Gb/s信号，色散受限距离约为1000km；10Gb/s信号只剩下60km；而40Gb/s信号则只有不到4km。对于G.655光纤，上述三种传输比特率的色散受限距离大约分别是4000km，300km，18km。因此，对于40Gb/s WDM系统来说，色散补偿是一个迫切需要解决的大问题。

10Gb/sWDM系统中最常用的色散补偿模块（Dispersion Compensation Module，DCM）是基于色散补偿光纤（Dispersion Compensation Fiber，DCF）的商用的DCM通常同光线路放大器（OLA）集成在一起，OLA采用掺铒光纤放大器（Erbium-Doped Fiber Amplifier，EDFA），如图2-40所示。

图2-40 集成在光线路放大器中的商用DCM示意图

常用的色散补偿方案都采取“小的平均色散，大的局部色散、非完全补偿”的原则。40Gb/s WDM系统的线路补偿可以沿用DCF补偿技术，但是40Gb/s信号的色散容限更小，因此对补偿的精度要求更高。同时由于色散斜率、工程误差等问题，40Gb/s WDM系统必须采用可调精确色散补偿技术（TDC）。

图2-41 色散斜率引起的残余色散示意图

常用的可调色散补偿模块（TDCM）是基于光纤布拉格光栅（FBG）技术研制的，如图2-42所示。色散调谐范围一般在±（300～800）ps/nm。TDCM的使用极大地降低了40Gb/s WDM系统对线路色散补偿的要求，因此可以在现有10Gb/s WDM系统上实现40Gb/s信号的传输。可以说，TDCM技术的成熟为40Gb/s WDM色散补偿方案的完善提供了最重要的保障。

图2-42 基于FBG的TDCM原理示意图

基于上述先进调制码型、增强型FEC、精确可调色散补偿等技术，40Gb/s WDM系统可以在1000km以上的80×40Gb/s WDM传输，从而实现了智能宽管道的重要目标：单链路速率为40Gb/s，单纤传输容量为3.2 T。

2.3.3 100Gb/s高速链路技术

随着全球范围内宽带用户数量和单用户带宽的持续增长，100Gb/s高速链路技术逐渐开始成为新的热点。但是，100Gb/s高速链路技术发展出现新的趋势，其导火索是在电信运营商网络中广泛应用的基于分组的SDH（POS）技术发展之路终结在了40Gb/s速率，人们需要寻找一种新的接口技术。

IEEE在100Gb/s高速链路技术的发展中起到了主导作用。IEEE从2008年开始推动100Gb/s高速以太网（100GE）的标准化工作，最终于2010年完成了IEEE 802.3ba，定义了100GE标准，形成了100Gb/s高速链路技术最重要的一个标准。

IEEE 802.3ba定义了4种100GE接口，对应于3种传输介质（铜缆、多模光纤MMF和单模光纤SMF）和3种目标传输距离（100m/125m，10km和30km/40km），详见表2-5。对于骨干网的应用，主要需要考虑目标10km单模光纤传输的100GBASE-LR4接口；而100GBASE-ER4接口，由于技术和成本限制，近几年尚无规模商用的可能。

表2-5 100GE接口类型及定义

值得注意的是，IEEE定义的几种100GE接口均为并行接口，这使得100GE接口的技术难度极大地降低了；但100Gb/s WDM传输出于提高频谱利用率的考虑，必须采用单波道100G的串行接口，这就大大增加了100Gb/s WDM传输的技术难度，从而对100Gb/s WDM传输技术的发展和应用提出了极大挑战。

ITU-T国际电信联盟电信标准化部门SG15工作组与100 G/bs相关的标准化工作主要由Q6和Q11两个课题组承担，其中Q6主要关注WDM传输相关的调制码型和各项性能参数，Q11主要关注100GE与光传输网络（OTN）架构的兼容性。随着100GE基准速率的确定，目前OPU4/ODU4/OTU4的基本速率和帧结构已经完成并列入最新修订的G.709中，标准化的OTU4速率为112Gb/s，采用传统的RS（255,239）作为标准FEC。已经确定采用通用映射规程（GMP）作为100GE映射到OPU4的手段，至此100GE over OTN标准体系在技术上已经完成建构。为了重用IEEE定义的4×25Gb/s并行光模块，G.709还定义了新的100Gb/s并行OTU4接口（OTL4.4）。这项定义也使100Gb/s高速链路技术出现了一个新的选择，即OTL4.4接口，采用100GE经GMP映射到OTL4.4的映射路径，其好处是具有OTN开销处理和告警处理功能，能够继承传统POS技术所具备的完善的OAM功能。目前也有部分路由器设备厂商表示将开发100Gb/s OTL4.4高速接口板卡，下一步发展还需要给予更多的关注。

光网络互联论坛（OIF）在100Gb/s标准化方面的贡献包括两个方面：一方面是对100Gb/s光模块和光接口的定义；另一方面是对100Gb/s DWDM传输码型、FEC等技术的研究和定义，两方面的工作都很有成效。但是相对来讲，100Gb/s光模块和光接口方面的贡献更加明显和重要，延续了OIF在该领域多年来的地位和作用，对100Gb/s传输技术的发展和应用作出了贡献。

综上所述，ITU-T，IEEE和OIF三个主要国际标准化组织负责的与100Gb/s传输相关的技术标准都在2010年底前顺利完成，为100Gb/s高速链路技术的发展和应用奠定了良好的基础。

虽然100GE的传输距离相对于40Gb/s POS已经有了显著提升，目前已商用的100GBASE-LR4接口，在G.652光纤中的标称传输距离达到10km，100GBASE-ER4接口的标称距离更是达到40km，但是在骨干IP网络中，依旧需要用100Gb/s WDM传输系统实现长距离连接组网，100Gb/s WDM传输技术依然是决定100Gb/s高速链路技术规模应用的重要条件。

100Gb/s WDM传输技术在40Gb/s WDM传输技术基础上又有了显著进步，全面采用了相干光通信技术，相对于10Gb/s和40Gb/s WDM传输技术实现了质的飞跃。电信运营商对100Gb/s WDM传输系统的基本要求是：

● 必须支持50GHz信号间隔；

● 长途传输无电中继传输距离达到1000～1500km，同时必须支持最多6个可重构光分插复用器（ROADM）级联；

● 城域网络中传输距离要求较短，但是需要支持更多的ROADM级联。

相干光通信技术除了传统上认为的相干接收技术比直接检测技术具有3dB灵敏度优势以外，还随着数字信号处理技术的发展正在不断成熟，基于数字信号处理（DSP）技术处理的相干接收可充分发掘光载波的信息加载维度，使光调制格式的种类更加丰富，实现多进制、双偏振信号的电域解调解复用等处理；同时采用各类DSP算法，能够有效对抗光纤信道的各类物理损伤的影响，从而显著提高光路传输性能。因此，与DSP的结合，可使相干接收成为未来超高速率光传输发展的主流方向。

相干光通信技术的优势主要体现在以下几点：

（1）实现更多的信息加载维度

相干通信技术与直接检测技术的根本差异在于增加了可利用的光载波自由度。直接检测技术仅利用了光载波的幅度，相干检测则能同时利用光载波的幅度与相位维度，在此基础上可实现各种多进制系统（如QPSK，QAM）的调制和解调。因此，在保证符号速率不变的同时，相干通信技术有效地提升了比特速率，进而实现了较高的频谱利用效率。

偏分复用技术把光载波的利用维度扩展到偏振态上。光纤中的基模信号可以分解为两路正交的偏振态，并能够独立的承载信息。因此，偏振复用技术进一步增加了光谱利用率，在一定的传输容量下降低了信号的符号速率，增加了系统对抗光纤链路中物理损伤的能力。使用基于相干分集接收、自适应解复用算法，使接收端解复用更为灵活，成为提升频谱效率、增加系统容量的又一有效途径。

（2）具有灵敏度优势

相干通信系统的本振激光器可以提供高质量激光源。在接收端，接收信号与本振激光混频后的输出信号是与本振激光的能量相关的，增加本振激光的功率便能提升输出信号的信噪比，由此增加了接收机的灵敏度。

（3）实现传输损伤的有效补偿

目前，相干通信技术发展的最大推动力在于DSP技术的引入。光脉冲信号在光纤中传输往往受到很多物理效应的影响，导致信号的畸变。由于光学器件工艺和发展水平的限制，在光域补偿信号损伤，往往成本昂贵且可重构性差；相反，电域处理技术非常成熟，成本相对低廉，能够灵活地进行重配操作，DSP算法的多样性保证了对抗系统损伤的有效性。但同时也应看到，在高速通信场景下，实时电域处理成为技术难点，目前模数转换器（ADC）和数字信号处理（DSP）已成为技术瓶颈和各厂商的核心竞争力。

虽然业界已经一致将相干光通信作为100Gb/s WDM传输的技术路线，但是各个设备厂商的产品千差万别。我们将该方案的调制方式统一称为偏振复用正交相移键控（PM-QPSK，Polarization Multiplexing Quadrature Phase-Shift Keying ）。

PM-QPSK调制通过采用2个偏振态来传输比特信息，能将通道速率降低一半，同时，由于每个偏振态可以使用4个（差分，Differential）相位来表示比特信息，又可以实现通道速率降低一半，因此，对于112Gb/s的比特率（Bit-rate），PM-（D）QPSK编码信号波特率（Baud-rate）可以降至28Gb/s。

图2-43（a）是112Gb/s PM-QPSK的发射机原理示意图，其中PBS为偏振分离器件，PBC为偏振合波器，LD为本振激光器。激光器输出的连续光经过一个偏振分离器件PBS后产生两路偏振态相互垂直的光波，2个QPSK调制器分别对这两路光进行调制，每个调制器由两路28G数据进行驱动，调制后的两路QPSK信号经过一个偏振合波器复用成一路112G PM-QPSK偏振复用信号输出。

图2-43（b）是其对应的相干接收机（其中，Aybrid 90为90°混频器，ADC为模数转换，DSP为数字信号处理器），包括一个窄线宽的本振激光器（LP）、2个90°混频器和4个PIN管，光电转换后的信号经过高速ADC采样后，送至DSP进行后端处理。

图2-43 100Gb/s PM-QPSK信号发射机和接收机原理示意图

由于相干接收保留了信号相位信息，因此可以通过算法实现色散和偏振膜色散（PMD）的电域补偿，目前商用100Gb/s WDM设备可以提供30000ps/nm以上的色散容限和75～100ps/nm的PMD容限，从而实现1000km以上甚至1500km以上无色散补偿传输，同时光纤光缆的适用范围也远远超出10Gb/s和40Gb/s WDM系统。

在2.3.2节介绍40G高速链路技术时，已经说明了FEC技术的重要性，在100Gb/s WDM系传输系统中，FEC技术得到了进一步发展。

在目前10Gb/s和40Gb/s WDM系统中得到规模应用的FEC技术，均采用了硬判决（Hard Decision，HD）算法，其中40Gb/s WDM系统中广泛使用的EFEC技术是一种7%编码冗余的硬判决FEC技术，对应纠错后误码率1×10-12的纠前误码率（Pre-FEC BER）容限大约是2×10-3左右。100Gb/s WDM系统中通过算法的改进，同样采用7%编码冗余，Pre-FEC BER容限可以提高到4×10-3左右。但是这样还远远不够，为了进一步提高编码增益，一方面可以提高编码冗余，另一方面可以采用更新的算法和判决方式，所以软判决（Soft Decision，SD）算法开始出现并得到了业界的关注。

硬判决比较简单，易于工程实现；软判决译码充分利用了信道输出波形信息，比硬判决译码具有更大编码增益，图2-44是在不同开销下分别采用硬判决译码算法和软判决译码算法的理论编码增益比较。

图2-44 软判决和硬判决性能比较图

软判决译码比硬判决译码具有更好的增益性能，并且随着FEC开销的增加，软判决译码的优势更明显。根据目前了解的设备实现情况，软判决FEC技术可以将100G信号的纠错容限提高到1×10-2数量级，净编码增益（NCG）从EFEC技术的8.5dB左右提高到11dB左右（以1×10-15的纠后误码率为基准）。

综上所述，从理论上判断，软判决译码比硬判决译码具有更好的增益性能，但是低开销FEC技术（例如近似7%）采用软判决译码所增加的实现复杂度和额外的延迟时间代价，将超过编码增益性能提升所带来的利益，因此建议选择硬判决；若超长距离传输需要更好的编码增益，建议采用更高开销的FEC技术（例如近似20%）加上软判决译码方式。

随着100Gb/s WDM传输技术和设备的逐渐成熟，100Gb/s高速链路技术规模部署的条件逐渐成熟。由于传统POS技术在40Gb/s速率已处于终结状态，100Gb/s高速链路接口类型的选择成为一个不确定因素，目前主要的选择是IEEE定义的100GE，以及采用100GE内核但是增加光传输网络（OTN）开销和OAM能力的OTL4.4两种接口。业界需要就100Gb/s高速链路接口技术尽快作出选择，以免影响100G高速链路技术的部署。