一种基于智能弹性架构的纵向异构方案

2014-06-06 10:46张玉芳陈光礼熊忠阳严德汗
计算机工程 2014年9期
关键词:异构交换机报文

张玉芳,陈光礼,熊忠阳,严德汗

(1.重庆大学计算机学院,重庆400044;2.杭州华三通信技术有限公司北京研究所,北京100080)

一种基于智能弹性架构的纵向异构方案

张玉芳1,陈光礼1,熊忠阳1,严德汗2

(1.重庆大学计算机学院,重庆400044;2.杭州华三通信技术有限公司北京研究所,北京100080)

针对交换网络中现有基础架构设计复杂、端口扩展受限、维护成本高等问题,提出一种基于智能弹性架构(IRF)技术的纵向异构方案。将多台低端交换机与IRF系统虚拟成一台逻辑设备,以增加逻辑设备的端口数量、简化管理,并降低大交换网络的构建成本。在网络拓扑层,采用跨板聚合技术将低端交换机与IRF系统之间的链路进行捆绑,对该链路上的流量实施负载均衡分担;在协议控制层,将低端交换机的系统控制管理平面上移,由IRF系统进行集中控制和网络决策管理。从可靠性、端口扩展、维护方面与现有方案进行对比分析,实验结果表明,该方案能解决现有方案中的不足,并以较低的成本提高端口密度。

智能弹性架构;纵向异构;低端交换机;负载分担;可靠性;端口密度

1 概述

随着IT业务的不断发展,网络已成为企业IT运行的基石。企业的基础网络为支撑上层不断变化的应用要求也在不断地进行调整和演化。而在如今的大交换网络时代,网络的可靠性、流量负载均衡、后期可扩展和可维护性方面面临着越来越大的挑战。

以太网高可用性自动化网络标准EC-62439提出了冗余到网络和冗余至节点2类以太网冗余方案[1]。冗余到网络方案主要采用 STP(Spanning Tree Protocol),RSTP(Rapid Spanning Tree Protocol)和MSTP(Multi Spanning Tree Protocol)3种生成树协议技术[2]。其中,STP是基于802.1D的生成树协议,主要应用在早期的交换网络中。其虽能够解决网络环路和广播风暴问题[3],但不足之处是,当网络拓扑发生变化时,需要经过近60 s才能达到稳定。该收敛效果对网络的可靠性提出了挑战,不再适用于如今的大规模交换网络。此后,IEEE在此基础上提出了基于802.1W的RSTP协议。该协议通过重新细化端口角色、简化端口状态和采用新的状态转化机制,加快了网络的收敛速度。上述2种协议均是单生成树协议,若某条链路不在最小生成树协议选中的路径中,则该链路会被阻塞,其不能够再承载任何流量,致使链路转发流量不均衡,极端情况下会导致网络瘫痪。针对上述方案的不足,提出了基于802.1S的MSTP(多生成树协议)。该协议将整个交换网络划分成多个生成树域,每个生成树域由多棵生成树组成。在生成树域内,多个VLAN映射到不同的生成树实例,致使整个网络可流量均衡负载[4]。目前,该协议支持的技术方案已得到广泛应用,但其也存在不足,即当网络规模越来越大时,网络规划、设计较为复杂,并且后期的管理、维护成本也较高。

冗余至节点方案主要采用虚拟化技术,将多台网络设备虚拟化成一台逻辑设备,从而减少了网络的逻辑节点数,简化了网络管理。其典型代表包括Cisco的Stack wise、3COM的可扩展的弹性网络[5](eXpandable Resilient Networking,XRN),以及H3C的IRF堆叠技术[6-7]。其基本思想是:在不改变传统网络物理拓扑和现有布线方式的前提下,对同层设备进行横向整合,并在虚拟化设备上对所有成员设备统一进行配置和管理。由于虚拟技术所支持的设备移植了单台设备的所有网络特性,从而导致系统中能够虚拟的成员设备数量极为有限。例如,IRF方案在最佳情况下能够支持4台盒式设备或者2台分布式框式设备[8]。与MSTP方案相比,该方案减少了网络中的逻辑节点数,简化管理,从而进一步减少网络维护成本。

尽管上述方案能减少需要管理的节点数,简化管理,但在数据中心、云计算之类的大交换网络中,逻辑节点数依旧较多、管理较为复杂。针对此问题,本文提出一种基于智能弹性架构(Intelligent Resilient Framework,IRF)的纵向异构方案。该方案通过将低端交换机作为业务板,与较高端的IRF系统进行跨层异构,达到以较低成本扩展更多数量设备的目的,从而在一个逻辑设备中提供更多端口,以降低整个交换网络中的逻辑节点数。

2 IRF技术

IRF技术是针对交换机集群技术中受不同厂商的专用协议技术、固定设备型号的限制而提出的一种通用虚拟化技术[8]。该方案将多台同系列网络设备在物理层进行屏蔽,对外虚拟成一台逻辑设备。系统控制层面和业务转发平面完全分离,在整个逻辑设备中通过拓扑收集、角色选举、主备倒换。将整个系统只分成一个master和多个slaver,实时进行1∶N备份,而不再采用集群技术中,将交换机集群分成命令交换机、成员交换机、备份交换机和候选交换机4种角色。

该方案采用多级分布式技术来保证软件架构的通用性。同时,通过多激活检测来维护整个系统的稳定与可靠,其中包括基于双向转发检测[9-10]、基于免费地址解析协议和基于链路聚合协议[11]的分裂检测。

3 纵向异构方案介绍

3.1 方案描述

本文在IRF方案的基础上提出了一种纵向异构技术方案,该方案对汇聚层、接入层设备采用性能高低搭配方式进行纵向整合。在物理拓扑方面,本文方案模拟分布式框式设备中接口板与主控板之间的连接关系,将每台低端设备与IRF系统中的多台成员设备进行跨板互连,如图1中的标识符①所示。通过5个阶段完成该异构方案的拓扑建立。在上层协议控制方面,本文方案采用控制平面和业务转发平面完全分离的技术,将 IRF系统中选举出的Master作为异构方案的控制设备,管理整个系统的上层协议,比如路由协议(包括 OSPF/IS-IS/RIP/ BGP)和标签转发协议(包括LDP/RSVP-TE/BGP)。将学习后形成的路由信息表(RIB)、标签信息表(LIB)、路由转发信息表(FIB)和标签转发信息表(LFIB),下发到IRF系统中各成员设备。在本文方案中,所有成员设备均可作为业务板,进行业务转发。而低端设备性能较IRF成员设备低,本文方案假设其不具备独立转发能力,只参与端口关联紧密的功能。因此,来自低端设备的业务将通过对原始报文进行内部数据封装,重定向到上层系统进行决策转发;需要转发到低端设备的业务,需在上层系统进行必要修改,在低端设备只需直接提取出端口地址进行转发。

图1 纵向异构拓扑

3.2 方案实现

3.2.1 相关术语定义

本文方案将IRF方案中对整个系统进行管理的主用主控板称为主板MCB(Main Control Board),简称M;将用于对M中相关协议热备份的备用主控板称为备板BCB(Backups Control Board),简称B;而将只用于业务转发的低端交换机称为业务板LPU (Line Processing Unit),简称L;将用于管理L的唯一逻辑单元的逻辑聚合组LAG(Logic Aggregation Group)称为LA。li为本方案中第i块业务板;lak为该方案中的聚合组k;slak为第k个聚合组的槽号;rsli为第i块业务板的运行状态;crs为IRF与业务板槽号的临界值。

3.2.2 拓扑构建

在本文方案中,L与M之间将通过配置、扩展槽号请求、版本请求更新、L注册、配置与转发表下发5个阶段来完成异构系统拓扑构建。并且每个L与IRF系统之间的异构过程独立,定期通过“hello”检查报文来维护异构系统的稳定。低端设备li与IRF系统之间拓扑构建的过程如下:

(1)配置阶段

该阶段主要实现在M上对设备li进行异构配置。首先,本文方案利用LACP技术在IRF系统上创建一个逻辑聚合组lak。该聚合组将成为异构系统管理设备li的唯一逻辑单元,其主要信息包括li的扩展槽号slak、li运行状态rsli{on|off|loading},以及纵向聚合链路vl{slak/plak}。其次,对lak中的配置进行初始化。1)动态分配 slak:为统一管理异构系统,本文方案设置了槽号临界值crs,当 slak大于 crs时的设备为L,否则为IRF成员设备。因此,用户只需为lak中分配一个大于crs的唯一值即可。2)对lak进行物理端口动态绑定:例如,将如图1中标识符②,③,④所指端口加入到lak中。与IRF方案类似,本文方案也将扩展槽号引入到端口中,以保证所有端口在异构系统中唯一。同时加入到lak中的成员端口成为系统的内部端口,只参与内部报文的转发,外部邻居不可访问。因此,lak中的成员端口承载着 li与 IRF系统之间的全部流量转发功能。3)rsli是该异构系统对li学习的结果。rsli会随着 li在系统中的不同阶段而动态改变。例如,li未加入异构系统之前,rsli状态为off,系统不对lak中的端口进行业务转发决策;反之,当li成功加入该系统,且未异常,则rsli状态为on,并让对应lak中的端口采用内部业务报文和配置报文的决策与转发。

(2)请求与分配阶段

本文方案在IRF系统平台上可以运行若干个lak,而在每个li上仅允许运行一个laj。laj主动向lak发送扩展槽号slak请求直到li与IRF完成绑定。即当在laj上完成对li的配置,并成功建立第一个链路后,li会定期从laj中选择链路状态为Block的端口通过上行链路向lak发送slak请求报文。若lak中接收到slak请求报文的端口来自主板M,则可直接按图2进行相应的分配处理。而若来自备板B则需首先将该报文通过IRF互联链路转发给主板M,再进行同样处理。

图2 槽号分配处理过程

(3)L版本加载阶段

laj与lak建立映射后,li方可与M进行最新版本信息交互。首先,li通过上行链路向M发送版本信息比较报文。待li收到M上拥有的最新li版本信息后,与自身保存的版本信息进行比对:若两者一致,则li无需加载,自动重启,否则,li通过向M发送版本请求,更新本地版本信息,然后加载,加载完成确认等交互,最后重启完成li对M的版本加载。

(4)L注册阶段

li完成最新版本加载后,主动向M响应一次板热插拔事件[12],M根据现有机制完成li在IRF系统中的注册。

(5)配置下发阶段

li完成在IRF系统上的注册后,M会把li的当前配置下发到li上。

任何li成功完成这5个阶段后,均能够动态地加入到IRF系统中,并通过链路检测机制来实时维护最新的拓扑结构。当li离开IRF系统时,由于本文方案具有超时机制,能够主动响应一次板拔出事件,从而将slak从IRF系统中注销。但仍然保留lai,且处于监听状态,并实时等待新的设备li加入。若lai被用户主动删除,或者成员端口被解除绑定,则这些成员端口恢复到普通端口模式。

3.2.3 业务转发

与IRF方案类似,本文方案中主板M会定期与外部邻居进行协议的状态更新,从而获得全网的实时路由信息。主板M将路由信息与必要二层网络信息形成FIB、LFIB转发表,最终下发到M和B管理的所有接口卡。而本文方案中的li主要是对M和B的端口进行扩展,成本低,但性能不及M和B。因此,假设li不具备独立查表转发能力,其业务需要通过“内部通道”由上层决策。于是,本文方案增加了一种新的内部报文头,其格式如图3所示。

图3 业务报文封装格式

业务流量转发的决策过程如下:

当li收到外部邻居报文后,首先提取li中接收到报文的端口p和槽号slak,按照图3所示的内部报文封装格式,对原报文进行封装,然后通过纵向链路重定向到上层平台lak进行转发决策。当上层lak收到来自li中聚合组laj的报文后,首先对报文进行解包,获取该报文的目的地址,然后进行查表,若转发表中存在,则按照转发表的信息,将转发出端口所在槽号slak、端口p以及类型进行必要修改,重新封装,通过“内部链路”转发到相应设备。若不存在,则需将该内部报文重定向到主板M进行地址学习,完成上述转发决策,并将学习到的转发表在所有备板B上进行备份。当li收到上层lak方向的报文后,首先对报文进行内部解包,提取类型和出端口,若为转发报文,则直接将解后的报文从出端口转发,否则丢弃。

3.2.4 流量负载均衡

由于每个lai的成员端口都支持动态LACP协议,因此成员端口之间都能够承担流量负载[12]。在聚合组lai中,首先每条链路的本端(Actor)与对端(Partner)能够依据之前交互的聚合信息,建立起链路聚合控制状态[13]。然后每条链路会周期性交互LACP数据报文来维护该链路的有效性。即聚合链路中的本端和对端双方定期互相发送一次握手报文。若在规定时间内未收到对端的握手报文,则本文方案认为该链路已断开,无法继续工作,需要将该链路状态设置为阻塞状态,不进行转发链路选择;否则该链路一直处于转发状态,允许被选中为转发链路。

同时本文方案采用更优越的路径选择决策方法,保证流量在网络链路上负载分担。即对laj与lak之间的报文根据其类型和转发方向(分为上行流量和下行流量)进行不同的决策。当来自li的上行流量报文时,单播和组播采用特定Hash均衡算法,在laj中被选中的链路进行流量均衡分配。转发路径如图4中①,②,③的箭头方向所示。当来自M或者B的下行流量时,若报文为单播,则对lak中成员端口采用本地转发优先策略,避免通过IRF互连链路进行跨设备转发,占用横向链路带宽。若存在多条本地链路,则对这些链路进行HASH选路,路径如图4中的④,⑤所示。若没有本地链路,才通过IRF横向聚合链路,绕道lak中的其他成员端口进行转发。若报文为组播时,本文方案将在每个lai中选择一条到对应laj的最短链路进行转发其中广播和组播策略一致。

图4 流量负载分担

因此,本文方案采用LACP技术、基于报文类型和纵向链路流量方向的负载均衡策略,能确保整个网络流量在纵向链路中负载均衡,同时降低了下行流量占用IRF系统横向链路带宽的机率。

4 性能分析

本文方案对IRF系统进行纵向异构的过程中,采用高低性能搭配、多级冗余设计、更优转发策略,从而使本文方案在可靠性、扩展性与维护性等方面得到较大提高。

4.1 可靠性

一方面,由于IRF方案是把多台物理设备虚拟成一台逻辑设备,所有成员设备的端口都成为公共端口,因此本文方案将这些公共端口进行跨板聚合[13]形成若干个逻辑聚合组 LA{la1,la2,…,lak,…},其中,每个lak中的所有成员端口都运行LACP协议。例如,当l1与IRF系统建立拓扑后,图5中的标识符①,②,③所指链路将捆绑成一条逻辑链路。只有当该逻辑链路中第一条链路建立或最后一条链路释放时,才需要进行对整个交换网络l2/l3重收敛计算和对FIB、LFIB表更新,这种链路冗余设计方式减少了因为某条物理改变导致网络拓扑重计算频率,使业务能够不中断转发的概率得到显著提高。而在现有的方案中,每个li都作为交换网络的一个节点,图中标识符①,②,③所指向链路作为交换网络中的生成树被选动态桥段之一,当网络中任何一条链路状态发生变化时,均需通过生成树协议进行重收敛计算,找出最佳生成树,降低了网络运行的可靠性。另一方面,在整个异构系统运行过程中,主板M会将本文方案中的运行协议配置信息、支撑协议的运行数据(比如状态机或者会话表项等)以及转发表,在每个备板B上进行1∶N协议热备份[14]。这种备份设计能够在主板M出现故障时,根据IRF的主备倒换技术快速从备板B中选出新的主板M接管故障设备;在备板B出现故障时,仅需对故障设备上业务快速切换到其他非故障设备;在有新lk加入时,主板M能快速下发相关配置,使其正常运行,从而保证了该异构系统在协议层面更可靠。因此,本文方案的多冗余设计有效地提高了系统的可靠性。

图5 多级冗余设计

4.2 扩展性

由于本文方案中低端交换机只运行与端口相关的功能,其他配置与业务决策管理均由处理能力更强的上层交换机实现,因此能够对更多的低端设备进行异构,有效解决了IRF系统端口扩展受限的不足。如下所示,可计算出该方案(交换网络中的一个逻辑节点)能提供的端口数:

其中,N表示该方案提供的端口总数;Npl3表示支持IRF方案的一台三层交换机端口数量;Nl3为三层交换机的数量;Npl2为一台作为li的二层交换机端口数量;Nl2为二层交换机的数量;Ali为设备li上聚合成员端口的总数。根据实验,得到如表1所示的实验数据。

表1 最佳异构匹配实验结果

根据上述实验数据和N的计算公式可以得到本文方案与其他2种方案单个逻辑节点端口扩展能力对比情况,如图6所示。结果显示,本文方案在端口扩展方面比其他2种方案具有明显优势。同时也注意到扩展并不是理论上的线性关系,其原因主要是随着业务板的增多,整个系统处理负载加重。

图6 单个逻辑节点端口扩展性比较

4.3 维护性

在大交换网络中,可以根据本文方案端口扩展的优势,采用最佳数量比的低端交换机和处理能力较强的交换机进行异构来构建整个交换网络。通过表1实验数据和N的计算公式模拟在大交换网络中提供相同数量的端口时网络中的逻辑节点数和高低端设备组成情况,实验结果如图7和图8所示。图7的结果显示,在大交换网络中,提供相同端口本方案逻辑节点数远低于其他2种方案,特别是网络中需提供端口数量越多,效果越明显;图8的结果显示,在大交换网络中,本文方案低端设备占设备总数的比例也是随着端口的增加而增大(如图8中从上向下第2条线所示),而其他2种方案只能采用处理能力较强的设备(如图8中从上向下第1条线所示,2个方案线条重合,而低端设备数始终为零,2条线横坐标轴上重合)。这大大降低了构建同等级网络的成本。

图7 交换网中相同数量端口的管理节点数比较

图8 交换网络中的各层设备数量

5 结束语

本文采用跨板链路聚合和网络集中控制决策技术,将2种不同性能的网络设备纵向异构成一台逻辑设备,大大降低整个交换网络中的逻辑节点数,简化后期维护和网络管理,同时明显改善了端口扩展性。随着网络设备处理能力的提高,今后还需解决业务板本地业务本地化管理的问题,缓解上层系统的负担。

[1] Huynh M,Goose S,Mohapatra P.Resilience Technologies in Ethernet[J].Computer Networks,2010,54(1):57-78.

[2] 李延冰,马 跃,王 博,等.IEEE三种生成树技术分析与比较[J].计算机应用,2005,25(11):2499-2501.

[3] 郭彦伟,郑建德.生成树协议与交换网络环路研究[J].厦门大学学报:自然科学版,2006,45(增刊): 301-304.

[4] de Sousa A F.Load Balance and Resilience of Ethernet Carrier Networks with IEEE 802.1S Multiple Spanning Tree Protocol[C]//Proc.of Networking International Conference on Systems and International Conference on Mobile Communication.Morne,Mauritius:[s.n.],2006: 95-101.

[5] Guo Yucheng,Guo Qingping.A Virtual Server Scheme Based on LVS and XRN[C]//Proc.of International Symposium on Distributed Computing and Applications to Business,Engineering and Science Proceedings. Wuhan,China:[s.n.],2004:140-143.

[6] 杭州华三通信技术有限公司.IRF 2.0技术白皮书[Z].2009.

[7] 杭州华三通信技术有限公司.H3C S12500 IRF2.0技术白皮书[Z].2012.

[8] 陈丽佳.络设备IRF虚拟化堆叠技术设计与实现[D].南京:南京邮电大学,2011.

[9] Fils C,Word D D.Technique forDistinguishing Between Link and Node Failure Using Bidirectional Forwarding Detection(BFD):USA,US8082340[P]. 2011-12-20.

[10] 高 鑫.向转发检测(BFD)协议研究[D].北京:北京邮电大学,2007.

[11] 王培英,肖志辉,李本源.基于LACP多激活检测方法和处理机制的研究[J].电信科学,2013,(5):95-99.

[12] 陈志列,庞观士,刘志永,等.Compact PCI热插拔系统设计与应用[J].铁道通信信号,2011,47(5):13-17.

[13] 郑 涛,郭裕顺.基于LACP协议的链路聚合状态机模块的实现[J].计算机系统应用,2010,19(5): 104-108.

[14] 李晓娟,陈存社.热备份路由及负载均衡在VLAN中的实现[J].计算机工程与设计,2005,26(5): 1203-1204.

编辑 任吉慧

A Longitudinal Heterogeneous Scheme Based on Intelligent Resilient Framework

ZHANG Yu-fang1,CHEN Guang-li1,XIONG Zhong-yang1,YAN De-han2
(1.College of Computer Science,Chongqing University,Chongqing 400044,China;
2.Research Institute of Beijing,H3C Technologies Co.,Ltd.,Beijing 100080,China)

Aiming at the existing problems in the current network infrastructure,which have complex design,limited port expansion and high maintenance costs.This paper proposes a longitudinal heterogeneous technology scheme based on Intelligent Resilient Framework(IRF)virtualization technology.This scheme virtualizes several low-end switches and IRF system into a single logical device.On one hand,the numbers of ports of the logic device are increased,meanwhile it is sampler to manage for big switching network.On the other hand,the scheme reduces the cost of building big switching network.In the plane of network topology,multiple longitudinal links between low-end switch and IRF system are bound to a logic link by LACP technology,and the traffic can be balanced sharing among them.In the plane of protocol control, the system control and management pane of the low-end switch is shifted up,and it is centrally controlled and decided by IRF system.Finally,the paper analyzes the reliability,traffic load balancing,expansion and maintenance with the existing schemes.Experimental results show the scheme can solve the shortcomings of the existing schemes,and enhance the port density with lower costs.

Intelligent Resilient Framework(IRF);longitudinal heterogeneous;low-end switch;balanced sharing; reliability;port density

1000-3428(2014)09-0096-06

A

TP393.02

10.3969/j.issn.1000-3428.2014.09.020

张玉芳(1956-),女,教授、博士,主研方向:数据挖掘,网络入侵检测;陈光礼,硕士研究生;熊忠阳,博士;严德汗,硕士。

2013-09-02

2013-11-08E-mail:pzhcgl@163.com

猜你喜欢
异构交换机报文
基于J1939 协议多包报文的时序研究及应用
试论同课异构之“同”与“异”
CTCS-2级报文数据管理需求分析和实现
浅析反驳类报文要点
修复损坏的交换机NOS
使用链路聚合进行交换机互联
异构醇醚在超浓缩洗衣液中的应用探索
overlay SDN实现异构兼容的关键技术
ATS与列车通信报文分析
LTE异构网技术与组网研究