|
第三步:故障诊断和排除
监控工具使您对存储区域网络(SAN)中存在的故障有所警觉,并为您提供一些信息,帮助您诊断故障。如果发生故障,可以采用一种从SAN中心开始的迭代方法,以确定故障所在。
从中心开始进行故障诊断
从您的SAN中心-交换机开始进行故障诊断。由于交换机位于主机和存储设备之间,并且您从那里可以看到存储网络两端的情况,因此从交换机开始进行故障诊断可以将搜索路径分为2个部分。在排除了网络发生故障的可能性后,您就能判断问题发生在存储端还是主机端,并从该位置开始进行更加仔细的诊断。通过这种方法,您能够迅速查明故障并防止故障扩大。
例如,如果主机无法看到存储设备,您就能运行一个交换机命令,查看存储设备是否正确连接至交换机。如果没有,您应该首先检查存储设备。应使用诊断工具来查找为什么交换机能看见存储设备的原因。一旦您从存储设备上看到了交换机,而主机上却看不到存储设备,那么就可确定主机和交换机之间存在故障。如果没有发生这种情况,则可以使用主机诊断程序来确定交换机看不到存储设备的原因。
故障诊断重点区域
进行故障诊断时,您可能会遇到4类常见问题:
Fabric
·设备丢失
·虚接(连接不稳定)
·分区配置错误
·交换机配置错误
存储设备
·交换机和存储设备之间的物理故障
·存储软件配置错误
主机
·主机总线适配器安装错误
·设备驱动程序安装错误
·设备驱动程序配置错误
存储管理应用程序
·软件对应的存储设备安装和配置错误
例如,如果使用了一个容量管理应用程序,应检查:
->容量安装错误
->容量配置错误
帮助您进行故障诊断的工具
您可以使用多种工具对SAN进行故障诊断:
Fabric
·交换机LED
·进行诊断的交换机命令(命令行)
·基于Web或GUI的监控和管理软件工具。
·带有先进诊断功能的实时分布式Fabric操作系统。
存储设备
·设备LED
·存储诊断工具
主机
·主机 适配LED
·主机操作系统诊断工具
·设备驱动程序诊断工具
存储管理应用程序
·专用工具和资源
联系您SAN支持厂商
如果使用所述技术和工具无法解决问题, 可以向支持厂商寻求帮助。在致电咨询前,请书写一份概要,尽量提供更多的支持细节。您的供应商产品手册可能带有一份工作表,其中总结了您在致电咨询前必须收集的信息,您也可以使用此模板创建您自己的支持工作单(DOC) 。
如果您对SAN有了基本理解,除了特别复杂的问题之外,您自己几乎能够解决所有问题。SAN的冗余和重新路由的功能使系统能够继续运行,从而给您充裕的时间进行故障诊断并解决问题,或者向SAN支持厂商寻求帮助。 |
|