2018年12月にソフトバンクで発生した通信障害は3060万回線、復旧まで4時間半で過去最大級の規模と言われていました。
今回のKDDIの障害は7月2日 1時25分に発生し、24時間経過しても完全復旧に至ってはいませんが、徐々に復旧はしてきているようです。
物流・自動車、気象、銀行、交通の情報システムが利用できなくなるなど問題も具体的になっており、ソフトバンクを大きく超える規模の障害事例となりそうです。
7/3 11時からKDDIの記者会見が開かれています。
影響件数は?
最大3915万回線でソフトバンクの3060万回線より大きいです。
影響時間は?
7月2日 1時25分に発生して既に24間を経過しています。
原因は?
メンテナンス(トラフィックルートの変更)中にVoLTE交換機でアラーム(一部の音声トラフィックが不通状態)が発生した当該トラフィックルートの切り戻しを実施。この切り戻し後のトラフィックの集中によりVoLTE交換機の輻輳が発生したため流量制御を設定。並行で加入者DBの負荷が上がりデータ不一致が発生、データの修正を実施。
記者会見の内容を簡単にまとめているので、正確には記者会見の内容を確認して下さい。
★VoLTE交換機~加入者DBはどのようなデータ連携があり、どのような状態でDBは輻輳となるのか、具体的な公表はされないかもしれませんが気になるところです。DB設計の問題かもしれませんね。現在も障害対応中でありアップデートはあるかもしれません。
作業は委託先?
KDDIのエンジニア(社員 or 派遣社員かは不明)が対応していた。つまり他のSIer等による作業ではないようです。
損賠賠償は?
障害発生から24時間以内に復旧しないと損害賠償の対象になるようですが、記者会見で損害賠償について明確な回答はありません。調査中でありこの時点で名言できないのは当然のことだと思います。
行政処分は?
現状から察するに行政処分は免れないと思います。
記者会見の雰囲気
個人的にKDDI側の現時点での回答は妥当だと思います。社長は技術出身のようでそれなりの説明(今は社長であることを鑑みた)ができていると思いますし、素人が回答することによる無用な混乱は避けられていると思います。