交換機的優越性能和價格的大幅度下降,促使了交換機的迅速普及。網絡管理員在工作中經常會遇到各種各樣的交換機故障,如何迅速、準確地查出故障並排除故障呢?本文就常見的故障類型和排障步驟做壹個簡單的介紹。由於交換機在公司網絡中應用範圍非常廣泛,從低端到中端,從中端到高端,幾乎涉及每個級別的產品,所以交換機發生故障的機率比路由器,硬件防火墻等要高很多,這也是為什麽我們首先討論交換機故障的分類與排除故障步驟的原因。
壹,交換機故障分類:
交換機故障壹般可以分為硬件故障和軟件故障兩大類。硬件故障主要指交換機電源、背板、模塊、端口等部件的故障,可以分為以下幾類。
(1)電源故障:
由於外部供電不穩定,或者電源線路老化或者雷擊等原因導致電源損壞或者風扇停止,從而不能正常工作。由於電源緣故而導致機內其他部件損壞的事情也經常發生。
如果面板上的POWER指示燈是綠色的,就表示是正常的;如果該指示燈滅了,則說明交換機沒有正常供電。這類問題很容易發現,也很容易解決,同時也是最容易預防的。
針對這類故障,首先應該做好外部電源的供應工作,壹般通過引入獨立的電力線來提供獨立的電源,並添加穩壓器來避免瞬間高壓或低壓現象。如果條件允許,可以添加UPS(不間斷電源)來保證交換機的正常供電,有的UPS提供穩壓功能,而有的沒有,選擇時要註意。在機房內設置專業的避雷措施,來避免雷電對交換機的傷害。現在有很多做避雷工程的專業公司,實施網絡布線時可以考慮。
(2)端口故障:
這是最常見的硬件故障,無論是光纖端口還是雙絞線的RJ-45端口,在插拔接頭時壹定要小心。如果不小心把光纖插頭弄臟,可能導致光纖端口汙染而不能正常通信。我們經常看到很多人喜歡帶電插拔接頭,理論上講是可以的,但是這樣也無意中增加了端口的故障發生率。在搬運時不小心,也可能導致端口物理損壞。如果購買的水晶頭尺寸偏大,插入交換機時,也容易破壞端口。此外,如果接在端口上的雙絞線有壹段暴露在室外,萬壹這根電纜被雷電擊中,就會導致所連交換機端口被擊壞,或者造成更加不可預料的損傷。
壹般情況下,端口故障是某壹個或者幾個端口損壞。所以,在排除了端口所連計算機的故障後,可以通過更換所連端口,來判斷其是否損壞。遇到此類故障,可以在電源關閉後,用酒精棉球清洗端口。如果端口確實被損壞,那就只能更換端口了。
(3)模塊故障:
交換機是由很多模塊組成,比如:堆疊模塊、管理模塊(也叫控制模塊)、擴展模塊等。這些模塊發生故障的機率很小,不過壹旦出現問題,就會遭受巨大的經濟損失。如果插拔模塊時不小心,或者搬運交換機時受到碰撞,或者電源不穩定等情況,都可能導致此類故障的發生。
當然上面提到的這3個模塊都有外部接口,比較容易辨認,有的還可以通過模塊上的指示燈來辨別故障。比如:堆疊模塊上有壹個扁平的梯形端口,或者有的交換機上是壹個類似於USB的接口。管理模塊上有壹個CONSOLE口,用於和網管計算機建立連接,方便管理。如果擴展模塊是光纖連接的話,會有壹對光纖接口。
在排除此類故障時,首先確保交換機及模塊的電源正常供應,然後檢查各個模塊是否插在正確的位置上,最後檢查連接模塊的線纜是否正常。在連接管理模塊時,還要考慮它是否采用規定的連接速率,是否有奇偶校驗,是否有數據流控制等因素。連接擴展模塊時,需要檢查是否匹配通信模式,比如:使用全雙工模式還是半雙工模式。當然如果確認模塊有故障,解決的方法只有壹個,那就是應當立即聯系供應商給以更換。
(4)背板故障:
交換機的各個模塊都是接插在背板上的。如果環境潮濕,電路板受潮短路,或者元器件因高溫、雷擊等因素而受損都會造成電路板不能正常工作。比如:散熱性能不好或環境溫度太高導致機內溫度升高,指使元器件燒壞。
在外部電源正常供電的情況下,如果交換機的各個內部模塊都不能正常工作,那就可能是背板壞了,遇到這種情況即使是電器維修工程師,恐怕也無計可施,惟壹的辦法就是更換背板了。
(5)線纜故障:
其實這類故障從理論上講,不屬於交換機本身的故障,但在實際使用中,電纜故障經常導致交換機系統或端口不能正常工作,所以這裏也把這類故障歸入交換機硬件故障。比如接頭接插不緊,線纜制作時順序排列錯誤或者不規範,線纜連接時應該用交叉線卻使用了直連線,光纜中的兩根光纖交錯連接,錯誤的線路連接導致網絡環路等。
從上面的幾種硬件故障來看,機房環境不佳極易導致各種硬件故障,所以我們在建設機房時,必須先做好防雷接地及供電電源、室內溫度、室內濕度、防電磁幹擾、防靜電等環境的建設,為網絡設備的正常工作提供良好的環境。
二,交換機故障的壹般排障步驟:
交換機的故障多種多樣,不同的故障有不同的表現形式。故障分析時要通過各種現象靈活運用排除方法(如排除發、對比法、替換法),找出故障所在,並及時排除。
(1)排除法:
當我們面對故障現象並分析問題時,無意中就已經學會使用排除法來確定發生故障的方向了。這種方法是指依據所觀察到的故障現象,盡可能全面地列舉出所有可能發生的故障,然後逐個分析、排除。在排除時要遵循有簡到繁的原則,提高效率。使用這種方法可以應付各種各樣的故障,但維護人員需要有較強的邏輯思維,對交換機知識有全面深入的了解。
(2)對比法:
所謂對比法,就是利用現有的、相同型號的且能夠正常運行的交換機作為參考對象,和故障交換機之間進行對比,從而找出故障點。這種方法簡單有效,尤其是系統配置上的故障,只要簡單地對比壹下就能找出配置的不同點,但是有時要找壹臺型號相同、配置相同的交換機也不是壹件容易的事。
(3)替換法:
這是我們最常用的方法,也是在維修電腦中使用頻率較高的方法。替換法是指使用正常的交換機部件來替換可能有故障的部件,從而找出故障點的方法。它主要用於硬件故障的診斷,但需要註意的是,替換的部件必須是相同品牌、相同型號的同類交換機才行。
當然為了使排障工作有章可循,我們可以在故障分析時,按照以下的原則來分析。
1、由遠到近
端口模塊—>水平線纜—>跳線—>交換機這樣壹條路線,逐個檢查,先排除遠端故障的可能。
2、由外而內
如果交換機存在故障,我們可以先從外部的各種指示燈上辨別,然後根據故障指示,再來檢查內部的相應部件是否存在問題。比如POWER LED為綠燈表示電源供應正常,熄滅表示沒有電源供應;LINK LEDs為黃色表示現在該連接工作在10Mb/s,綠色表示為100 Mb/s,熄滅表示沒有連接,閃爍表示端口被管理員手動關閉;RDP LED表示冗余電源;MGMT LED表示管理員模塊。無論能否從外面的出故障所在,都必須登錄交換機以確定具體的故障所在,並進行相應的排障措施。
3、由軟到硬
發生故障,誰都不想動不動就那螺絲刀去先拆了交換機再說,所以在檢查時,總是先從系統配置或系統軟件上著手進行排查。如果軟件上不能解決問題,那就是硬件有問題了。比如某端口不好用,那我們可以先檢查用戶所連接的端口是否不在相應的VLAN中,或者該端口是否被其他的管理員關閉,或者配置上的其他原因。如果排除了系統和配置上的各種可能,那就可以懷疑到真正的問題所在——硬件故障上。
4、先易後難
在遇到故障分析較復雜時,必須先從簡單操作或配置來著手排除。這樣可以加快故障排除的速度,提高效率。
三,總結:
由於交換機故障現象多種多樣,沒有固定的排除步驟,而有的故障往往具有明確的方向性,壹眼就能識別得出。所以只能根據具體情況具體分析了,當然不管是什麽樣的故障對於壹個新上任的網絡管理員來說都是困難的事,所以如果妳希望能夠成為交換機故障的排除高手,就壹定要在日常工作中積累經驗,每弄好壹個問題都用心的去回顧問題根源以及解決方法。這樣才能不斷的提高自己,更好的完成網絡管理的重任。