間違いだらけのネットワーク作り(453)2006/09/23
「IP電話の長時間障害」

すっかり秋らしくなりました。 今朝は好天で、気持ちのいい風が吹きぬける居間のソファーでノンビリ新聞を読んでいるだけで幸せな気分になります。  こうしてパソコンを打っている机の前の窓からも風が流れ込んで、引きこもっていてもさわやかな感じがします。 ここのところ出張が多く、来週は関西、再来週は関西、九州と動きまわるので、土日は引きこもりでバランスが取れるのです。 

9月25日(月)、ITPROWatcherに新しいコラムが掲載されます。 テーマは「『営業』は何を売るのか?」です。  そう訊かれたらどう答えるでしょう? ソリューション、商品、サービス等、人によって色々な答えがあるでしょうね。 日々「売れない、売れない」と困っている営業マンは是非、読んでください。 眼からウロコが落ちるかも知れません。

「IP電話の長時間障害」

連休明けの19日火曜日から3日連続でNTT東日本のIP電話サービス、光電話が障害を起こしました。 新聞の報道は以下のとおりでした。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
○9月20日日経朝刊 「IP電話の障害11時間後に復旧」
IP電話サービスが19日午前9時ごろからつながりにくくなった障害は午後7時59分に回復。 73万回線のIP電話に影響。 1部のサーバーに負荷がかかり、全面ダウンを避けるためNTT東日本が通話を規制。

○9月20日日経夕刊「IP電話また障害」
光電話が20日10時ごろから再びつながりにくくなった。 システムを再起動する作業をするために通話を制限しているのが原因。

○9月21日日経夕刊「光IP電話不具合続く」
NTT東日本は光電話の発着信を午前9時4分から50%に規制。 光電話同士の発着信を除き、つながりにくい状況。 いつ通常の通話状態に戻るかまだ分からないという。

○9月22日日経朝刊「IP電話脆弱さ露呈」
NTT東日本のIP電話に通信障害が発生してから21日で3日が経過。 発着信規制まで余儀なくされたが原因も分からないまま。 脆弱さを露呈。 埼玉県北本市では市民からの苦情が殺到。  契約者約80万(8月末)の大半は個人だが、中小企業や個人事業主で八千社、大企業も千五百社が加入。 

○9月23日日経朝刊「IP電話不具合 サーバー障害が発端 NTT東「安全宣言」持ち越し
NTT東日本は22日、光IP電話にトラブルが起きた原因の発端について、法人向けの通話を管理するサーバーのソフトウェアに不具合があったと発表した。 19日午前に特殊な通話機能が集中し、処理できずに通話障害が起きたという。 さらに広範囲の通話を管理する「中継サーバー」にも通話が集中し、ネットワーク全体が不安定になった。 19日夜にいったん通話が回復した後、中継サーバーの初期化がうまくいかず、二十、二十一日も通話制限を続けざるを得なかった。 22日は負荷の分散などを進め、4日ぶりに通話制限をせずに運用できた。 サーバーの不具合は23日に修正するが、詳細な原因究明は続けるため「安全宣言」は持ち越し。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

光電話の仕組みが明らかにされていないので、よく分からない内容です。 読み取れるのは19日から20日までは打つ手がなく、通話規制していただけ。 負荷分散などをすすめ22日は4日ぶりに規制を解除。 発端となった法人向けの通話を管理するサーバーの不具合は23日に修正する。 言い換えれば、22日までは不具合を修正せず対症療法で対応した。

原因が法人向けサーバーにあり、トラブルのきっかけが特殊な通話機能にあるとすれば、その機能だけ殺してしまえばここまで広範囲な影響を出さずに済むように思うのですが、実際は複雑な仕組みがあって簡単には行かなかったのでしょうね。 (ITPROの記事によれば特殊な機能とは「代表着信」とのこと。 これは特殊でも何でもないですね。 止めることは出来ません。)

それにしても22日朝刊の記事によれば80万加入のうち、法人は1万加入足らず。 1%強の加入者を管理するサーバーの不具合が広範なトラブルにつながるところが理解に苦しむところです。 システムとして障害を自動的に局所化する仕組みがないのか、運用上の対策でもっとうまい方法がなかったのか。 21日の記事では光電話同士の発着信は規制していないようなので、中継サーバーというのはレガシーな電話網とIP電話網を接続するシグナリング・ゲートウェイなのか? 等々、想像が膨らみます。 とにかく残念なのは解決に時間がかかりすぎたことです。 

現在のIP電話はIMSで動いているわけでもなくNGNと同一の仕組みではないにせよ、SIPベースのIP電話である点では変わりません。 2010年に3000万加入を目指すNGNの「安全・安心」を信じてもらうには、80万程度のIP電話でトラブルを起こしていたのでは話になりません。 NGNの盛り上がりに期待している私としては、今回のトラブルの原因や再発防止策が一般のユーザーだけでなく、ネットワークを仕事とする人にも充分納得いく形で示されることを望みます。 でないと企業にIP電話を提案するにも、光電話でなく、ISDNのままで提案する業者が増えてしまいます。 光電話にもNGNにもブレーキがかかります。  何より信用回復に大切なのは、再発させないことです。 半年もしないうちに同様のトラブルが起こったら、本当に大変なことになってしまいます。 頑張って欲しいものです。
 

ホームページへ