CiscoルーターにQoS入れてたらハングした話。
ネットワークインフラの巨人といえばCiscoSystems。
インフラ稼業をやってたら必ず耳にし、目にするメーカーです。
私も、まぁ、Ciscoの狗みたいなもんで(笑)散々振り回されております(^^;
とあるWAN先の拠点、まぁ、データセンターみたいな感じのところなのですが、そこに向けて大量のバックアップデータを送りつけてる機器が数台ございまして。
WANサービス網の帯域上限いっぱいに貼り付いた状態になっておりました。
そしたらそのサービス事業者さんから連絡がありまして。
「あの拠点、貼り付いてますが大丈夫ですかね??」と心配されてしまいました。
まぁ、確かに上限張り付きは問題ですから、さっそく対策を打つことに。
-
発信元がWindowsServerだった場合はOS側でポリシーベースQoSが掛けられるのでそれで対処しました。(やったことは別掲しますね)
問題は某ストレージ専用機のレプリケーション。
こいつ、帯域幅があるだけ使ってしまう脳筋仕様で、独自のQoS機能も搭載されてないという漢らしい機器です。
他のシステムをそれぞれシェイピングしてもこの機器のおかげで帯域いっぱいまで貼り付いちゃうんですね。
ということで仕方がなくWAN側ルーターでQoS(シェーピング)を掛けることにしました。
ルーターのWAN側ポートにはサービス品目に合わせたQoSがサービス事業者の方で掛けられているのでいじれないので、LAN側ポートで送出側で設定を実施。
・アクセスリストで条件を作り、
・ポリシーマップで効果を決めて
・インターフェースにアタッチする。
という手順で設定を行っていきます。
あれ??
設定上はかかっているのに回線の実測値に反映されない。。。
showコマンドで見てもアクセスリストのカウンターが更新されないぞ???
おかしいなぁ。。
と思案してたら監視システムがアラートを上げてきました。
なんとWANのインターフェースがダウンしてる。。。
というよりハングしてる感じになってました。
設定したのはLAN側なのに。。。
予備機での実験はうまく行ったのになぁ。
インターフェースのShutdows>>no shutdownでの回復しなかったため仕方なくreloadコマンドでルータをリブートしました。
復旧後、QoSも正しくかかり、予定通りの実測値を得ることができました。
しかし、なんでハングするかなぁ。。
回線の帯域上限に貼り付いてて処理能力的にいっぱいいっぱいだったんでしょうかね??
Cisco機器では初めての経験でした。