文章詳情

一線網絡故障診斷

日期:2025-05-04 23:22
瀏覽次數:2072
摘要:
一線網絡故障診斷
使用福祿克網絡的LinkRunner.鏈路通排除網絡故障的實際操作步驟和方法
美國福祿克網絡公司
當網絡客戶端宕機時,技術人員的工作就是讓它恢複正常工作。在當今的商業環境中,他們的首要任務就是讓網絡經濟、高效地工作。在任何網絡環境中,為技術人員提供適當培訓、恰當的工具以及可靠的方法,可以幫助他們更快地排除網絡故障,節省時間,同時還能使網絡用戶儘快恢複高效工作。
排除故障的心態及方法
技術人員要成功地排除故障,關鍵是要了解正常的網絡運行情況。這樣,技術人員就能迅速地查找到異常情況,而其他方法則無異於盲目猜想。
遺憾的是,許多網絡產品都冇有提供充足的性能說明、操作原理或精煉的技術數據來指導進行故障診斷。成功的技術人員應**調研所有的可用數據,同時深入了解所有組件的功能及其操作方法。*後,他(她)會意識到某些嚴重故障的根源往往在於使用和配置方法不當或誤操作。
這種洞察力來自正規培訓,並且隨著實踐經驗的不斷豐富而變得更加敏銳。真正精於故障診斷的技術人員善於在實踐中學習,通過反複試驗、與彆人交流意見,發現課本中冇有卻很實用的方法。下麵的信息能夠讓您少走彎路,並且針對查找和解決網絡問題的方法提出了一些中肯意見。
成功的故障診斷人員應迅速掌握以下基本概念:簡單評測故障症狀,這樣可以避免將大量時間耗費在追查錯誤問題上。必須將所有的信息和報告的故障症狀結合起來考慮,同時還要考慮到它們與整個網絡運行之間的關係;隻有這樣,技術人員才能真正了解故障症狀的含義。收集到有關故障症狀數據之後,就要進行檢測來驗證或排除一些問題。

成功排除故障的五個步驟
在解決和處理網絡問題的過程中,成功的技術人員會采取一致的方法:
1、對網絡進行文檔備案
實時了解*新的文檔(如物理和邏輯圖、性能基準及審計、設備庫存、配置、主機地址表等),這樣就會大大節省故障排除過程的“查找”過程時間,從而輕鬆找到PC機在整個網絡中的位置。
2、收集所有可用信息,分析故障症狀
考慮一下自己是否理解這些故障症狀。用戶能否演示出現的故障,或者您能否重現這個故障?確定在出現故障之前,工作站或網絡是否有某些變動。
3、查找並分析問題
縮小問題的範圍。問題與某網段相關,還是與某個客戶端有關?對於某個客戶端,我們可以進一步將它細劃到網絡、物理布線或工作站的範圍內。您會發現,收集信息和查找問題往往是同時進行的。
4、糾正故障和確認故障的解決方案
找到問題之後,就可以輕鬆確定和糾正具體故障。對於網絡硬件,*簡單有效的方法就是更換部件,如更換損壞的跳線、集線器/交換機端口或客戶端網卡(NIC)。當用戶檢測故障(采用**解決該問題的做法)時,就要完成此步操作,確保已修複故障。
5、對所采取的措施進行文檔備案
回到**步。記錄故障及其解決方案(正如許多故障單應用程序所提供的一樣)可以構建企業內部知識庫,供以後發生類似故障時參考。該信息可以迅速排除今後的故障。

這步操作真的必要嗎?
儘管操作係統軟件的可靠性不斷提高,但是“重啟計算機”仍然是專業技術服務人員的“絕技”。重新冷啟動可以解決很多無法解釋的問題,因而確實是不可替代的一步。該操作的好處就是使技術人員不用離開座位就能解決問題。
除了讓用戶重啟機器之外,可以在前往工作站之前,給用戶打電話了解更多信息。
大多數用戶都可以打開命令提示符,並向技術人員彙報IPCONFIG命令的執行結果。這樣,就可以告訴技術人員PC機在所連接的子網中的地址是否正確。
?如果PC機配置為動態主機控製協議(DHCP),卻返回了Windows默認的IP地址(169.254.x.x)))),那麼表示客戶端冇有與DHCP服務器正確連接。
? 筆記本電腦可以正確尋址所連接的網絡,但是有時在離開網絡後,它仍然會保留另一子網的DHCP租約。讓用戶在命令
提示符下鍵入兩條命令,提出新請求:
C: >ipconfig /release
C: >ipconfig /renew
收到新IP 地址之後,讓用戶嘗試使用網絡。如果IPCONFIG 命令報告無法執行DHCP,那麼用戶可能正在使用靜態IP配置。根據網絡文檔,驗證所報告的IP 地址。
? 如果用戶報告了有效的IP 地址,則嘗試從您的機器上對該地址進行PING 操作。如果用戶的PC機有響應,則請用戶嘗試其他的聯網操作,如打開網頁或PING本地路由器確,認基本連通性。如果這些檢測都無法解決問題,那麼就應該到用戶的現場解決。

現場檢驗客戶端的問題
到達可能出現故障的工作站後,應仔細收集各種信息。詢問用戶有關任何可能影響網絡性能的行為或活動。由於用戶可能冇有注意到許多工作站或工作區相關的常規操作會影響網絡性能,或者他們明知自己的操作不當卻不願承認,因此,有時這種做法意義不大。向用戶詳細詢問您所懷疑的問題,注意一定要詢問*近所有的變動,甚至包括辦公家具的移動或新屏幕保護程序的安裝情況。
重複您在電話裡要求用戶執行的檢測。如果能夠成功地PING到網絡服務器或離線設備,那麼就表示該工作站與網絡的連接達到了第三層,此時即可確定“冇必要”進行所有低層級檢測,而技術人員也可將工作重點放在其他方麵。
如果無法驗證第三層連接,那麼必須從**層開始檢測。
如果故障症狀是掛線或間斷性連接,那麼連續執行的PING 命令會向目標設備不斷發送回複請求數據包。每條成功執行的PING命令的響應時間或無響應時間將被顯示出來。

C: > ping -t x.x.x.x

可以使用連接到目標設備的跟蹤路徑(TRACERT或PATHPING)進一步調查超時響應或未執行的PING命令。路徑跟蹤能夠告知網絡中發生延遲或丟失數據包的位置,**層的故障排除就應該從這個位置開始。
C: > tracert x.x.x.x

C: > pathping x.x.x.x

需要擴大故障排除範圍嗎?
如果通過核實用戶的故障報告還不能明確問題所在,那就需要進行長時間的詳細調查。然而,在進行實地檢查之前進行
快速檢測,仍有可能快速解決這種情況。
既然用戶報告表明無法登錄到網絡,那麼技術人員關注的首要問題就是該故障是否與網絡或用戶的PC機有關。接下來,就是要確定客戶端與網絡是否正確連接和正常工作,客戶端能否訪問網絡。確保這些功能可以解決許多問題,同時也為解決更複雜的問題奠定了基礎。要及時、高效地解決網絡問題,就要求一線技術人員有一種能夠快速檢驗關鍵網絡功能狀態的工具,也例如福祿克網絡的LinkRunner鏈路通。

一線故障排除的“快速檢測”:
1、檢測鏈路
2、檢查整個網段的活動
3、利用DHCP 作為診斷工具
4、Ping 本地目標和遠程目標

檢測鏈路

許多網絡技術人員認為,網卡上的鏈路燈閃亮即表示存在鏈接脈衝。雖然人們信賴某些設備,但是許多鏈路LED都由主機係統中的軟件控製,並且當檢測到較高層級的網絡活動時,它也會處於“開啟”狀態。某些網卡也會使活動指示燈閃亮,指示存在網絡流量;作為聯網證據,這些要比鏈路LED更可靠。但是,這些LED 都不能指示傳輸速度或雙工設置情況,這需要另外調查加以證實。
可以通過自動協商過程來確定鏈路情況,在此過程中,鏈路雙方相互交換有關傳輸速度和雙工性能的信息。交換信息之後,鏈路雙方互比性能,然後以*高的共同速度和雙工匹配情況開始進行通訊。如果鏈路雙方中的任何一方配置有誤或驅動程序功能異常,那麼該過程就無法達成共同設置,而且通訊會時斷時續或完全中斷。

LinkRunner 通過單一線段成功發送和接收信號,檢測是否存在鏈接

連接至網絡接口後,LinkRunner首先嘗試與另一端能找到的“鏈路夥伴”建立鏈接,而這個“鏈路夥伴”可以是網絡連接器(集線器或開關),也可以是某個PC機的網卡。LinkRunner 遵循IEEE 802.3標準規定的自動協商過程,它是硬件控製(而非軟件控製)的鏈路指示器。在成功自動協商之後,LinkRunner 的LED呈淺綠色,同時在LinkRunner 屏幕的左上角
顯示傳輸速度和雙工設置情況。



LinkRunner 屏幕顯示成功鏈路狀態、傳輸速度和雙工設置及使用情況

檢查整個網段的活動
如果在電纜上可以看到網絡流量,那麼LinkRunner會在主屏幕的“利用率條形圖”上指示流量水平。但需要注意的是,如果連接到某個單獨的交換機端口(非共享介質),那麼就隻能看到廣播幀的流量,這種流量在低流量網絡上斷斷續續、很不連貫。
如果您正在檢測某個共享的以太網環境,而這個環境仍在使用集線器而不是交換機,那麼您的網絡很可能是半雙工運行方式。半雙工以太網受限於嘗試同時傳輸信號的工作站個數,以及所要傳輸的幀的大小。如果嘗試同時傳輸信號的工作站過多,以太網的性能可能會因衝突而明顯下降。如果您所測試的網絡是每個工作站均連接在單獨的交換機端口上,那麼就不用考慮站點超額情況。
雖然發生衝突是半雙工以太網運行過程中的正常現象,但是當衝突數量開始隨網絡流量的增大而增加時,網絡流量也會由於必要的重新傳輸操作而開始大幅度增加。這樣,網絡的性能就會突然“直線下降”,這是由於幀、衝突和重新傳輸操作的數量盤旋式上升及其速率的快速增長造成的。由於性能下降,所以用戶就會感覺到延遲並會提交故障單。
在大多數網絡中,以太網的流量水平並不重要,應該查找其他方麵的問題。通過提供網段使用情況的統計信息,LinkRunner能夠提供給用戶網絡性能異常信息的關鍵線索。

將DHCP 作為診斷工具

如果可以建立鏈接並且合理使用,那麼用戶就會按PING 測試所對應的按鈕。然後,LinkRunner將嘗試從DHCP 服務器獲得IP 地址。通常,DHCP 是一種基於廣播的技術。因此,它要求每個子網使用單獨的DHCP服務器(價格昂貴、難以管理)或者使用DHCP中繼代理服務器,當客戶端和服務器處於同一物理子網時,這種代理服務器可以在兩者之間傳遞請求和回複。路由器上的這些定向廣播輔助程序是那些想在中央位置運行DHCP服務器的大型企業的一種常用工具。客戶端或LinkRunner 的自動DHCP 配置失敗會導致DHCP 中繼係統發生故障。
雖然,必要時LinkRunner 能接受手工或靜態IP 配置,但是現在大多數網絡都能使用DHCP。獲取DHCP地址的過程體現了本地電纜、本地集線器或交換機端口的耐久性,以及與DHCP服務器相連的網絡基礎設施情況。在簡單操作中,附近大多數網絡基礎設施達到第三層。

成功分配DCHP地址表示客戶端的網絡通訊正常,並且能成功獲取IP地址,一步完成**到第三層的檢驗

PING 本地目標和遠程目標

在網絡曆史上,PING操作已經成為排除網絡故障的一種*常用的方法。在常用的每種Internet可用操作係統中,PING操作是大多數網絡技術人員在排除網絡故障的過程中首要采取的一個步驟。為何這一簡單工具如此有用?
在操作中,PING 就像海洋學中使用的聲納(SONAR )一樣。PING工具發送一種能從目標設備(能夠做出“回應應答”)“反射”回來的信號(通常是ICMP“請求回應”幀),這個“反射”信號告知發送方目標係統是否存在,以及信號到達目標設備和返回所用的時間。
配置DHCP服務器所提供的地址之後,LinkRunner會立刻向DNS(域名服務)服務器和默認的路由器發送PING測試,這兩個地址均由DHCP 配置過程提供。可以*多為LinkRunner預配置四個額外的目標IP地址,並且將其中一個作為自動進行PING測試的地址。如果某些關鍵網絡服務,如WEB應用程序、用戶認證等的PING操作成功,那麼就表示客戶端的服務本身有效。
PING操作成功表示兩台設備間存在著端到端第三層鏈接。如果需要進一步分析,那麼隻需將請求的往返總時間作為已知值,就可以進行有幫助的診斷,以便獲得更詳細的分析數據。但是,ICMP請**低優先級的網絡流量,而且當鏈路上的某台路由器或目標設備忙碌時,就會放棄這個請求。這就是為什麼發送一係列PING請求,給目標設備更多響應機會的原因。
企業網的外部服務器也能成為PING操作的目標設備,用以檢驗廣域網(WAN)從客戶端或本地站點至遠程站點的連通性。如果安裝了防火牆的服務器響應了PING操作,但是冇有安裝防火牆的服務器卻冇有響應,那麼網絡技術人員就應該查找路由器或其他網絡邊界基礎設施是否出現故障。如果某些服務器有響應,而另外一些卻冇有響應,那麼網絡技術人員應查找這些特殊網段出現故障的原因。如果對於外部服務器和內部服務器(包括應用程序和服務器),PING操作均有效,但是客戶端對PING操作卻冇有響應(實際上,也就是接受那些服務),那麼就表示物理傳輸以外的其他層級上出現故障。PING成功就意味著其他網絡流量也能到達目標服務器,如果仍無法訪問那些服務,那麼問題可能與服務器或用戶的登錄帳戶有關。

      

可以對本地係統或Internet上的所有係統執行PING操作

下一步該做什麼?
如果*初的“快速檢測”無法確定或解決問題,那麼下一步活動就應該明確兩個方向。
? 如果檢測表明無法建立以太網鏈接,那麼就要仔細檢查網絡電纜是否存在嚴重問題。
? 如果快速檢測成功、並顯示鏈路及合理網段流量水平、通過DHCP獲得了地址,同時還成功地PING了關鍵網絡服務器,
那麼可以在其他網絡層級的較高技術層麵來解決問題,或者由用戶帳戶管理員或個人電腦技術人員查找工作站配置問題。

電纜檢測

首先要檢查將工作站或設備連接到網絡牆壁接口的跳線。為此,隻需將電纜的一端插入LinkRunner的網絡接口,同時將另一端插入線序適配器插座中,就可進行快速的電纜連通性及正確性檢測。如果跳線正常,那麼將它再次插入牆壁或地板接口內,並作為進一步檢測的組件。
查找電纜問題的下一步就是檢查配線間和本地交換機中的電纜。在布滿電纜的配線間中,很難從眾多電纜中正確挑選出壞電纜,這種做法也很費時間,但是LinkRunner提供了兩項功能,使查找壞電纜的工作變得既簡單又迅速。首先,LinkRunner可以向電纜發出音頻信號,然後可以利用音頻探測器進行追蹤。使用標準的音頻探測器,可以係統地檢查電纜直至聽見壞電纜發出的音樂。當不能肯定電纜是否連接在交換機上,或者冇有文檔指示電纜與哪個配線間或交換機相連時,該方法將非常有用。
              
               LinkRunner可以提供**的跳線測試。


交叉跳線

和嚴重受損的跳線

找到用戶電纜的遠端位置之後,即可使用LinkRunner 線序適配器或某個可選的LinkRunner電纜編號附件(LinkRunner Cable IDAccessories)斷開該鏈路,並檢測全部水平電纜的連接和線對是否正常。
同時,Link Runner會發出音頻信號,並嘗試讓交換機端口鏈接路每隔三秒鐘閃亮一次。利用這個功能,可以方便地查找與電纜連接的端口。找到端口位置之後,就要將該電纜連接到其他未使用的端口上。通常,相鄰端口或故障端口會仍然顯示鏈路正常,因此切換到不同的端口可能會解決問題。

如果集線器或交換機端口檢測結果正常,那麼可能是工作站有問題。可以將LinkRunner直接連接到工作站的網卡上來進行檢測。與連接集線器或交換機類似,LinkRunner可以指示網卡的鏈路狀態、傳輸速度及雙工設置情況。如果顯示鏈路正常,請重啟PC機或使用PING之類的命令行工具,以觸發網絡流量並使用LinkRunner進行監控。如果LinkRunner報告無任何流量,那麼即使PC機顯示正在傳輸,也需要檢查綁定部件和PC機上的其他配置參數。如果LinkRunner同時報告鏈路和PC機的流量,那麼需要進一步診斷PC機的聯網配置情況。
高層級診斷
如果工作站建立了網絡鏈接,接下來就要確認工作站的尋址與它所連接的子網相符。確認工作站使用了恰當的協議堆棧並且配置正確。*後,技術人員必須檢驗所有必需的程序組件和數據庫正常。通常,首先要從工作站配置中刪除協議或網卡,然後再次重裝進行檢驗。如果所有這些組件的位置和配置都正常,而且工作站仍然顯示網絡和應用程序連接錯誤,那麼此時就要在區域技術水平之外逐步查找問題。

非凡工具,打造**業績

LinkRunner價格經濟、接口簡單,它是一種使用廣泛的工具,適於部門技術人員手持(或掛在腰帶上)使用。隻有“眾口皆碑”的網絡設備才能消除筆記本電腦測試本身所固有的不確定性。
正如網絡技術人員所說,假設是“眾口皆碑”的客戶端設備,那麼它所帶來的問題要遠遠多於它能解決的問題,而且當網絡支持和台式機客戶端分屬不同的小組時,不但會導致技術問題,還會導致政治問題或組織問題。當故障單上所指的設備不是台式機,而是網絡基礎設施組件時,這就是一個比較棘手的技術問題(儘管也有簡單的政治因素)。
在這種情況下,即便冇有常規設備診斷屏幕,那麼通過查找(排除)鏈路本身的故障,也會迅速找到問題所在。當在部門或小組範圍內就可以解決問題,而無需將每個問題逐級上報給IT專業技術人員時,問題會會更快、更有效地預以解決。可以在受過**故障診斷培訓的技術人員和工程師中間小範圍地使用**工具。故障診斷方案的目的是確保充分發揮**人材和技術資源的優勢。 福祿克網絡的LinkRunner 鏈路通是一款價格經濟的超便攜式工具,它可以在網絡故障診斷過程的初期階段助技術人員一臂之力。
LinkRunner是一種適於機構整體部署的簡易工具,它能幫助一線技術人員查找基本的連接故障,以及向更高層的技術人員報告故障單之前,解決物理層級出現的問題。
LinkRunner是現場檢測基本網絡連接情況的理想之選,它可以解決許多網絡問題,而且也是解決更複雜問題的必要前提。當技術人員利用LinkRunner進行現場故障檢測時,它能確定各種網絡運行重要參數,並提供解決ISO7 層堆棧中較高等級所誘發的故障的基本信息。
當網絡經理將基礎設施繼續遷移或升級到“開關到桌麵”時,他們體會到全開關基礎設施的好處:分割網絡流量,避免網絡內的以太網錯誤傳播。但是,這種開關基礎設施“隱藏”了影響各鏈路性能的較低層問題,讓一線技術人員隻能猜測連接的狀態。

分享到: