交换网络环境的故障诊断EtherScope网络通应用案例分析

1/5/2008来源:交换技术人气:2673

交换网络环境的故障诊断十年前,网络相对简单。网络设备包括集线器、网桥和路由器等,每个设备都是一个独立部分,相互之间可以识别。故障诊断也相对简单。假如连接的是一台集线器,故障诊断则采取对冲突域进行故障诊断的原则。在冲突域连接至一个网桥的地方所有问题都消失了。故障诊断这时协议分析仪是故障诊断的最佳选择之一,非凡是当用户了解了网络的基础和使用的协议后会更为有效。

 

在这之后,出现了交换机。

 

交换网络环境出现的问题与前面提到的共享介质环境的问题有些类似。例如:发生了什么问题,问题是谁带来的,问题有多么严重?最主要的区别是问题需要与交换机的一个特定端口相关联。

  • 在交换网络环境中应该考虑的问题包括:每个端口的忙碌状况
  • 如何识别和跟踪错误源?
  • 广播风暴的源头是什么?
  • 交换转发表是否运行正常?
  • 哪个站点连接在这个端口上?
  • 交换机对协议或端口是否有速率限制?
  • 这个端口在VLAN中吗?假如在是同服务器或服务在同一个VLAN中吗?

 

交换网络环境的故障诊断EtherScope网络通应用案例分析在一个交换网络里,您如何确定从哪里开始动手查找问题?想深入“透视”一个交换网络是非常困难的。首先,在2层交换的时候还是桥接转发方式,但到了3层交换却有了更高级的特性和转发规则,例如VLAN。到了4层交换,就更加复杂了,出现了更高级的转发和负载均衡技术,故障诊断故障诊断和解决就需要更多的交换机配置知识。

 

在安装完一台交换机后,每个交换机的半双工端口就构成了一个冲突域。假如该端口连接了一个集线器,集线器下面连接若干站点,那么冲突域会扩大。但随着交换产品的价格下跌,现在大多数新建的网络每个交换端口都只连接一个站点。因此,在半双工连接情况下,冲突域仅针对一个单独的电缆链路。

 

交换机通常是一个独立广播域的一部分,包括串连或者并连的任意数目的其他交换机。假如使用了OSI模型3层的功能,就可以创建多广播域,广播域的数目与VLAN数目相等。最极限的情况,假如交换机功能答应,每个端口可以配置为一个独立的广播域。可以把这种情况描述为路由到桌面。为每个端口创建一个独立的广播域后,故障诊断就会严格受限。但是假如我们把每个端口设置为一个单独的广播域,交换机在转发流量的时候,每个端口都需要路由服务,这会占用交换机CPU的有限资源。在网络环境中,对每个单独的端口进行路由请求和应答是非常困难的,我们应该避免这样的配置。不幸的是,这种情况在实际情况中非经常见,网络中经常发现服务器全部在一个子网或者广播域中,所有的客户在另外的子网或者广播域中。在这种情况下,所有的请求都必须路由。假如维护行为限制在一个单独的服务器群里,那么考虑把服务器放进单独的VLAN里。然后把使用这台服务器的用户放到同一个VLAN。这样就可以使用2层交换的桥接方式来交换流量,只有很少的请求需要路由。假如服务器支撑多于一个用户区,可以在服务器上多装一块网卡来实现到用户的2层交换连接。


对交换机进行故障诊断的5种技术

 

可以采取5种基本方式来透视交换机。每一种方法都不同,都有积极或者消极的一面。类似在网络中碰到的其他问题一样,没有一个最好的答案。最合适的方案往往取决于您手中可以利用到的资源(什么工具可以使用或者以前安装过什么工具),而且使用这些技术有可能造成服务中断。

即使把这些方式组合起来,也不能监测到所连接的网络,在交换的环境里面,也不像集线器那样方便监测。我们几乎不可能看到通过一个交换机的全部流量。大多数的故障诊断会假设流量会在站点和所连接的服务器之间或经过故障诊断交换机uplink口通过。而实际上假如2台主机直接传输信息的话,就不会使用交换机的uplink口或者任何其他的端口来交换流量。除非你知道具体用到哪个端口,否则是监测不到的。

举个例子,如图1,一台服务器接入一台交换机。在反映有问题的用户中,一部分是直接与这台交换机相连,另外的一部分用户是由这台交换机的uplink口从其他路由器或者交换机连接上来的。故障报告是访问服务器“慢”,这样的故障报告对技术支持工程师来说基本上没有任何价值。
交换网络环境的故障诊断EtherScope网络通应用案例分析
 
图一、一个最基本的交换机环境

 

方法1:通过TELNET或者串行口接入服务器

高级的网络技术支持工程师或其他知道交换机密码的人在进行故障诊断时可以选择通过TELENET或者交换机的串口登陆,来检查交换机的配置。(如图2)

交换网络环境的故障诊断EtherScope网络通应用案例分析
 
图 2、使用RS-232 控制端口

 


交换机配置可以通过上面提到的2种方法查看,虽然问题不一定是配置引起的。不管问题是操作系统有BUG还是配置不完善,都不能从配置列表中轻易的查看出。配置信息在定位交换机是否像预期的那样运行上比较有用,但针对故障诊断就不是了。为了验证交换机的配置,往往需要使用多种的交换机故障诊断方法配合。

 

很多交换机都带有实时的故障诊断工具,因为交换机生产厂家和型号的不同,这些故障解决工具的特征也各不相同。但是要使用好这些工具,必须依靠一定的理论知识和实际经验。

 

方法2:连接到一个空闲端口

 

最简单的故障诊断方法是在交换机的空闲端口接入一个监测工具,例如协议分析仪。

交换网络环境的故障诊断EtherScope网络通应用案例分析

 

图3、从任意端口监测