ネットワークトラブル対応徹底解説

この本は、無線編に用があって買ったのですが、他のパートもとても良いです。

今日は、ルータ編とスイッチ編を読みました。

ネットワークトラブル対応 徹底解説

ネットワークトラブル対応 徹底解説

システムはなぜダウンするのか』という本に、ちょっと似てます。あの本の事例のうち、ネットワークに関する話題に特化して、かつ、より具体的な製品の話題に寄せた感じだと思いました。

今のところ、一番興味を引かれたネタは、スイッチの内部構造に依存する障害の話(p.p.54-59)でした。ちょっとだけ紹介すると・・・

L2スイッチの各ポートは、内部のPHYチップ(Physical Layer Chip)に繋がっています。そのため、PHYチップを2つ持つスイッチでは、リンクアグリゲーションを構成する際に、2つのPHYチップの両方を使うように、接続するポートを選ぶ必要があります。本文の事例では、使ったポートが内部的に片方のPHYチップに集中していたために、1つのチップの故障で、すべてのリンクがダウンしてしまいました。・・・

うひゃーですね。正直、スイッチでこんなことが起き得るなんて知りませんでした。これまで自分が、ネットワーク機器をいかにブラックボックス扱いしてきたかを自覚しました(*_*; 勉強不足だ……。

システムはなぜダウンするのか

システムはなぜダウンするのか

閑話休題

障害を想定したネットワークアーキテクチャ、なんてよく言いますが、実際に作るには万能のカタログは存在しないので、構成固有の想定しうる障害と原因を洗い出し、それぞれにどう対処するかを考えるしかありません。

それができるようになるための一環として、「これこれの(構成|機器)には、こういった特性が(ある|ない)かもしれず、それはこういった事態を引き起こしうる」といった知識も、蓄積していく必要があります。*1

個人やチームが経験できる範囲には限界があるので、書籍や雑誌、Webで、知識の引き出しをせっせと補います。そんな時に、こういった本が教えてくれる"製品横断の観点"は、とても参考になり、ありがたいです。

情報収集を通して、障害対策について考えるための回路を、自分の頭の中にがっつり構築したいものです。

*1:といっても、tipsの収集だけでは不足なので、"一環"なわけですが。