ざっくりとネットワーク障害を切り分けする方法
クライアントPCやデバイスがインターネットやサーバに繋がらない場合に、私が行っている障害ポイントの切り分け方法をメモしておきます。
ざっくりとした内容ですが、何か参考になればと思います。
確認項目
とりあえず、こんな感じで確認作業を行うことが多いです。
- LANケーブルやWiFiが接続されているか確認
- デバイスのIPアドレスを確認
- pingによる疎通確認
- tracert,traceroute,tracepathによる通信経路確認
- 名前解決ができるか確認
- 他のデバイスで同様の現象が起きているか確認
- 接続先のルータやスイッチも確認
他にも色々とあると思いますが、とりあえず簡単に出来ることだけ説明していきます。
とりあえず再起動もあり
原因とかはどうでも良くて、なるべく早く復旧させたい場合は、デバイスの再起動を行って様子を見るという方法もあります。(障害の原因は不明のままとなりますが…)
色々と調査してみたけど原因がわからず、とりあえず再起動してみたら復旧したというケースもありました。
LANケーブルやWiFiが接続されているか確認
目視でLANケーブルがきちんと接続されているかを確認します。
LANケーブルのツメが壊れていて、見た目は接続されているように見えても、実際には半抜け状態や接続不良だったりすることもあるので、リンクランプ等も合わせて確認してください。
WiFiで接続している場合は、その接続状態も確認します。
デバイスのIPアドレスを確認
IPアドレス情報が正常に設定されているかを確認します。
GUIで確認できるならそれでも良いですし、コマンドを実行することで確認しても良いです。
- Windowsの場合: コマンドプロンプトでipconfig
- Linuxの場合: ip address
ひと目で色々な情報が分かりやすいので、私はコマンドを実行して確認するほうが多いです。
DHCPサーバからIPアドレスを取得できているか
IPアドレスを自動設定している場合は、DHCPサーバからIPアドレスを正常に取得できているか確認します。
「169.254.x.x」といったようなアドレスが設定されている場合は、正常にIPアドレスが割り振られていない状態です。
このような場合は、IPアドレスの再取得を行ってみます。
DHCPサーバからIPを再取得する方法(Windows)
コマンドプロンプトで下記コマンドを実行します。
ipconfig /renew
DHCPサーバからIPを再取得する方法(Linux)
dhclientコマンドを使用してIPアドレスの再取得を行うことが出来ます。
Ubuntuの場合
Ubuntuであれば下記のように実行します。
$ sudo dhclient -r # IPアドレスの開放 $ sudo dhclient # IPアドレスの再取得
ネットワークサービスを再起動させる場合は、こちらのコマンドを実行します。
$ sudo systemctl restart NetworkManager
CentOSの場合
CentOSなどはrootユーザにsuをしてからコマンドを実行してください。
sudoが使えるように設定されているのであれば、sudoを使用して実行しても良いです。
# dhclient -r # dhclient
ネットワークサービスを再起動させる場合は、rootユーザでこちらのコマンドを実行します。
# systemctl restart NetworkManager
pingによる疎通確認
ipアドレスの設定に問題がなければ、pingでの疎通確認を行っていきます。
疎通確認を行う対象はこんな感じです。
- 同じネットワークにあるデバイス
- DNSサーバ
- デフォルトゲートウェイ
- インターネットや別ネットワークにあるホスト
自分に近い場所から疎通確認を行って、どこに問題があるか切り分けています。
tracert・traceroute・tracepathで経路の確認
Windowsであればtracert、Linuxであればtracerouteやtracepathでネットワーク経路の通信確認を行うことが出来ます。
途中のファイアウォールなどでフィルタリングされている部分の情報は表示されません。
名前解決ができるか確認
IPアドレスでの通信は問題無いが、ホスト名での通信が出来ない場合は、名前解決ができてい無いことが原因であることが多いので、nslookupやdigで名前解決ができるかの確認を行います。
名前解決が出来ない場合は、別のDNSサーバを指定して名前解決が出来るか確認を行います。
別のDNSサーバでは名前解決ができる場合は、DNSサーバの障害が考えられます。
他のデバイスで同様の現象が起きているか確認
自分のデバイスだけの問題なのかどうかの切り分けるため、他のデバイスでも同様の問題が発生しているか確認します。
別のデバイスでも同様の問題が発生している場合は、自分のデバイス以外に障害ポイントがあると考えられます。
接続先のルータやスイッチも確認
機器に問題がないか接続ランプ等を目視で確認をします。
リンクランプが消えている
デバイスが接続されているポートや、アップリンクポートのランプを確認します。
全部のランプが消えているならば、機器の電源ケーブルが抜けていないか、電源がONになっているかの確認をします。
電源ケーブルや電源スイッチに問題がなければ機器に問題が発生しているかもしれません。
可能ならば、別のポートに差し替えてみたり、機器の再起動を行ってみます。
機器を再起動すると、当然ですが接続されている全てのデバイスに影響が出ますので、十分に注意をして作業を行って下さい。
全てのランプが激しく点滅している
全てのランプが激しく点滅してる場合などは、ループが発生している可能性があるので、直前にケーブルの抜き差しをしていないかを確認
ループ検知機能がついた機器であれば、該当のランプを確認することで確認できるはずです。
コメント