用交换机端口信息排故障

2018-11-07 07:15
网络安全和信息化 2018年9期
关键词:断网网线风暴

在网络运维中,经常要查看交换机端口,一个看端口状态,一个看端口信息。端口信息中含有大量的数据信息,包括状态、地址、带宽、输入输出包、广播包、错误包、CRC包等。认真观察、分析这些数据信息,有助于解决网络故障。本文介绍两个案例,就是通过查看交换机端口信息发现问题,从而找到相应解决方案。

注:本文使用的命令是锐捷交换机的命令,其他品牌的交换机,请使用对应的命令。

故障一:某栋楼汇聚断网,重启后2个小时后又断网,问题是广播包巨大。

一天早上刚上班,就发现学校的计电楼报断网了。马上查看网络设备监控流量图,发现确实网络断了,且从昨天起已经断网并自动回复了几次(如图1)。

图1 计电楼流量图

图2 汇聚交换机端口13的信息

因已经断网无法远程操作,于是让学院的人把汇聚交换机重启,重启后网络正常,可不到2个小时又断网了。查看流量图未发现汇聚交换机流量异常,各端口流量也正常。再次重启后进入汇聚交换机查看,以前此栋楼有过ARP包异常,sh nfpp arp-guard hosts未发现异常,sh cpu、 sh memory 也正常,sh interfaces gigabitEthernet一个个端口查看,感觉1/13端口广播包有些异常,广播数据包感觉有些大(如图2)。 然后sh int counters summary,发现13及14口的InBroadcastPkts数据比其他端口至少多出一位(如图3)。

当时正在下大雨,不想到现场抓包,马上把13、14口关闭。观察中,到下午14点上班时,计电楼整体网络正常,因为13、14端口各接一层楼的2台接入交换机,有近200个信息点,不可能关闭太久。据端口信息判断故障原因是广播包太多,而此楼的交换机未做广播网暴控制。交换机收到广播、未注册组播、未知单播3种报文后都会做广播处理,如果端口没有开启风暴控制,端口对收到广播包的速率将不做限制。当局域网中存在过量这3种数据流时,就会导致网络变慢和报文传输超时机率大大增加,这便是广播风暴。

广播风暴控制是通过控制端口接收广播包的速率,将只允许通过所设定带宽、每秒允许通过的报文数或者每秒允许通过的千比特数的数据流,超出限定范围部分的数据流将被丢弃,直到数据流恢复正常,从而避免形成网络风暴。于是在13、14端口增加使命命令stormcontrol broadcast level 2(锐捷交换机默认是1%),然后把端口打开,再迅速进入相应的接入交换机,对所有用户端口也增加stormcontrol broadcast level 2,通过 sh in gi及 sh in gi co su不断查看汇聚交换机的13、14端口只信息,广播包还在增长中,但速度不快,到下班时计电楼的网络都是正常的,第二天也是正常的。但感觉stormcontrol broadcast level 2有些太小,把14口改成level 5,随后几天继续观察,再没有断网,用户也能正常上网。虽然不知道是哪里是什么原因产生了大量的广播包,但通过广播风暴控制将此次断网故障解决了。

图3 汇聚交换机各端口的进出数据统计

图4 端口信息显示有大量的错误包及CRC包

故障二:某校区一办公楼的用户总是断网,而此交换机其他端口用户工作正常,只有一个端口上有大量的错误包

学校另一个校区一个新装修的办公室内多个用户反映网络总是中断,Ping网关时通时断,延时大。重启小交换机问题没有解决,电脑直接接信息点后还是有网络中断现象,而其他办公室的网络都是正常的。初步判断是信息点、网线或相应交换机端口有问题。

进入相应交换机查看,sh cpu、sh memor正常,用 show interface,show interface counter查看,发现对应的端口信息上有大量错误包及CRC包(如图4)。CRC错包一般是接口、双工异常、时钟与MTU中否一致、物理链路问题造成的,出现CRC错包后,首先要排除物理链路的影响。

重新拨插了水晶头,再测试还是有问题,找一个正常端口把有问题的网线插上问题依旧,判断是网线有问题。把根网线2头的水晶头重做并测试正常后,插入交换机,并换到一个正常的交换机端口,再次测试,Ping网关正常,电脑打开网页也正常了,在交换机新的端口信息上没有出现错误包了。故障原因是此办公室是新装修的,网线的水晶头未做好造成的。

经验总结

交换机的端口信息提供了大量的信息,包括括状态、地址、带宽、输入输出包、广播包、错误包、CRC包等,认真观察、分析这些数据信息,有助于解决网络故障。第一个案例是发现某些端口有大量的广播包,通过风暴控制来抑制,从而保障网络正常运行。第二个案例是发现某个端口有大量的错误包、CRC包,通过交叉替换发现是网线水晶头有问题,重做水晶头解决问题。在网络运维中经常要查看交换机端口信息,通过分析这些信息有助于解决网络故障。

猜你喜欢
断网网线风暴
脑风暴大挑战
《风暴中奔跑的树》
医药电商“断网”困局
头脑风暴
加强配网线损管理 提高企业经济效益
社会版(二)
2015A/W暗黑风暴来袭!
上课“断网”几多无奈
网线DIY的十二个原则