この記事は7/3午前中に記載したもので、まだKDDI社長の会見内容を反映していません。
今回のKDDIの障害が具体的にどういうサービスに影響が出るのものか、モバイルネットワーク初心者としてLTE/EPC/IMS周りの挙動の勉強のためにまとめてみた。
はじめにまとめ
モバイルの通信には音声通話とデータ通信があり、今回主に長時間の障害を受けたのは音声通話(IMS)の方だった。
7/2(土)の日中帯はデータ通信はできるが音声通話やそれに付属するサービスが利用できない状態が継続していた。データ通信も不安定な状態になっていた。
端末の実装(主にAndroid端末)によっては音声通話ができないとデータ通信も止めてしまう挙動があった。これによりLTEを回線として使用しAndroidベースで構築された決済システムなどが利用不可能な状態が継続した。
音声通話(IMS)が利用できないと、通常の電話はもちろん、緊急通報、SMS、位置情報の送信などの機能が利用できなくなる。IMSに依存しているキッズ携帯の機能が全滅して防犯上の課題も生じていた。
サービスの状況
- 7/2未明の障害発生時は音声通話とデータ通信の両方ができなかった
- 7/2 7時ごろにデータ通信が一部回復
- 7/2 午前中には圏外表示を繰り返すようになり不安定
- 以降データ通信も時々不安定になる状態が
- auの携帯電話に通話すると「現在使われておりません」となる
au、データ通信が一時的にできるようになったけど
— ♥️電波やくざ様は告らせたい♥️ (@denpa893) 2022年7月1日
音声通話はできないままだな pic.twitter.com/KWRznDz89m
KDDI広報の携帯に電話したが現在使われておりませんってながれるw
— ♥️電波やくざ様は告らせたい♥️ (@denpa893) 2022年7月2日
端末による挙動の違い
音声通話は使用できないがデータ通信は可能なので外出時もLINE等は利用可能かと思われたが AndroidとiPhoneでIMS障害時のデータ通信の挙動が違うらしいことがわかった。
- iPhone
- アンテナピクトは立っていないがデータ通信は可能であった
- ハンドオーバーしたときに時々データ通信もできなくなることがあった(4G表示が消える)ので完璧に通信可能というわけではなかった模様
- アンテナピクトは立っていないがデータ通信は可能であった
- Android
- データカード
- データ通信専用なので通常通り利用可能であったようだ
auの通信障害は、
— す ぃ (@WGM_sui) 2022年7月2日
Androidかつ通話機能付き=全く疎通せず(通話が通じないと通信にチャレンジしないものと思われる)
iPhone=アンテナピクトは立たないが通信は可能
通話機能がない端末(タブレット・WiMAX等)=通常通り
私の手持ち端末全部で試した結果はこれ。
データは通るけどIMSへの登録ができてない時の挙動は端末依存ですね。
— A.N (@chunta8) 2022年7月3日
特にAndroidはメーカー&機種&ファームウェア依存なので、一概に言えないようです。
SIMフリーの機種も増えてきて全ては把握不可能に近そうです。
例えば、OPPOの場合は、
ピクト全立ち&データ通信可能&音声不可
でした。
3Gへのフォールバックができない
VoLTEのIMS障害なのでVoLTEをオフにすれば3Gにフォールバックして使用可能になるかと思われたが、KDDIは3月末に3Gのサービスを終了していたので3Gにフォールバックできなかった。
5G SAは一部の法人ユーザに提供開始していたが、コンシュマー向けにはこの夏提供開始予定だった。
そのため3Gにも5Gにも切り替えることができず、ユーザ端末側からはどうしようもなかった。
追記
障害箇所の推測
- 端末の挙動を見る限りIMS Registrationに失敗している模様
- P-CSCFから先のI-SCSF、S-CSCF、HSSあたりでなにかあったんじゃないかと思われる
- [追記] 7/2日中帯ではIMSにつながるPGWとのセッション確立失敗が見えていたとのこと
- これにより前述のIMS Registrationが失敗したり、データ通信も不安定になっていたのだと推測される
- この事象を解決するタイミングで輻輳が開始した模様
- KDDIからもVoLTEの交換機故障による輻輳とアナウンスがあったのでIMSの障害で確定
- おそらく何かをトリガーにしてUEが一斉にVoLTEのIMS Registrationを一斉に送り始めて、CSCF以降のIMSでコントロールプレーンの輻輳(キャパシティを上回る要求)が発生した可能性が高い
- 他社携帯から架電すると「現在使われておりません」となるので、単なるP-CSCFの輻輳ではなくHSSあたりまでR/W負荷が集中して加入者情報の一貫性の喪失のような異常が起こっているのではないかと思われる
- 全国的に影響が出ていることからもP-CSCFのようなフロントエンドの輻輳ではなくHSSのようなバックエンド側で異常が起きてるように思われる
IMSの確立NGのcauseはesm #26 Insufficient resources
— まがのり (@maganori) 2022年7月2日
でreject。朝からts24.301開いてしまった。
serevice requestもたまに反応ないな#KDDI #au pic.twitter.com/kSW8btuF0w
VoLTE交換機=IMSのことで、青丸の当たりです。
— かねがえ|セキュリティ勉強中 元電話研究員 (@nekokane) 2022年7月2日
輻輳するなら入り口のP-CSCFかな? pic.twitter.com/Lka86CPHBW
7/2の未明は分からないですが、日中帯以降はIMS Registration失敗やIMS障害ではなく、IMSに繋がるPGWとのセッションの確立失敗に見えておりました。
— まがのり (@maganori) 2022年7月3日
会見では、きっかけはPGWとIMSの間のルータ障害と言っていたので、そこを通らない様変更しPGWとのセッションを解放&再確立させたら輻輳したと思います
エンドユーザへの影響
IMSが落ちたときにエンドユーザに対してどのような形で影響が出たのかを整理してみる。社会的な影響はpiyokangoさんがまとめてくれているので、技術的観点から。
緊急通報
緊急通報の発呼フローの中にIMS Registrationが含まれているため、IMSに接続できなくなると110や119への緊急通報も発呼できなくなる。
実際に登山中に転落された方がauだったために通報できない事例が発生した。
夫婦が登山中に夫が転倒し下山できなくなったが、2人ともauの携帯電話を使用していたため通報できず(別の登山者が通報し防災ヘリで救助) pic.twitter.com/NadBYuIuvm
— suken@今年は夏の熱戦を4Kで見よう (@takakuratch) 2022年7月2日
緊急通報はTS23.167 あたりかしら pic.twitter.com/S7QJERYy33
— omusubi (@omusubi5g) 2022年7月2日
緊急通報を取り扱う音声伝送役務は1時間または3万人を超えたら総務省の障害報告基準に当たるので、一発アウトだったと思われる。
SMS
SMSにはSMS over IMSとSMS over SGsがあるが、KDDIの一般的なスマートフォンでサポートしているのはSMS over IMSであったため、SMSもほぼ利用不可能になっていたと思われる。
SMSが利用不可能になったことにより、SMSログインやSMSによる二要素認証などのSMSに依存したシステムが使用不能になる。特に自社の公衆Wi-Fiの認証に自社のSMSを使ってしまうとこのような障害のときに困ることがわかった。
- Yahoo!JapanのSMSログイン
- au Wi-Fi SPOTのSMSログイン
- Amazonの二要素認証
- クレジットカード会社や銀行のSMS認証
KDDIさんは普通のスマホはSMS over IMS onlyなのか。https://t.co/IhTB8LUsyt pic.twitter.com/fFFV7UNPWH
— かねがえ|セキュリティ勉強中 元電話研究員 (@nekokane) 2022年7月3日
LINEモバイルのau回線だけど、WiFiだから大丈夫だって思ってたら、YahooのログインでSMS使えなくて詰んだ\(˙◁˙)/
— 心奏〈かなで〉 (@Isolation_wolf) 2022年7月2日
通信障害中のkddiからauの公衆wifiをお使いくださいというお知らせを頂いた。使ってみた。そもそも公衆wifiのログインがSMS認証が必要なので、認証コードが届かなくて笑った。中の人、頑張ってください。おもしろすぎた。 pic.twitter.com/ozzG48tgZT
— むらかみふくゆき Fukuyuki (@fukuyuki) 2022年7月2日
au の通信障害のせいでSMS認証出来ねぇ
— じょー∞ (@Full_investdfx) 2022年7月2日
2要素認証にのこんな弱点があったとは…
au障害のせいでSMS受信できなくて、Amazonログイン出来なくなったw
— ゆん (@Yun_ValeforFF14) 2022年7月2日
セキュリティ重視の二要素認証だから仕方ないとはいえorz
au復活したー!!
— BB (@ryotkbb) 2022年7月2日
ネットも電話もSMSもだめで、クレカのSMS二要素認証できなくて詰んでた
2台持ちとか勘弁だから、複数の回線を切り替えられるスマホ出ないかな(SIM差し替えも嫌w)
位置情報
端末の位置情報もIMSで送信されるため、IMSによる位置情報の収集・利用ができなくなる。IMS経由の位置情報に依存しているシステムは後述するキッズ携帯がある。
一方でバスのロケーションシステムはGPSで得た情報をデータ通信で送信していることが多いため、IMSには関係がなく利用できるはずだが影響が出ていた。影響を受けたシステムはAndroidベースの端末になっていてIMS障害の影響でデータ通信もできていなかった可能性が高い。
神奈中バスロケーションの不具合についてhttps://t.co/AjghOjpr5N
— かなち - カナちゃん号HP (@kanachango) 2022年7月2日
KDDIの通信障害の影響により車両通信が安定せず一部不具合 pic.twitter.com/5CC4xNOtVz
ICカード決済やクレジットカード決済
バスなどの移動体や自動販売機や精算機でICカードやクレジットカードの決済ができなくなった模様。LTE回線を使用してデータ通信で実装されていることが多いので、これらのシステムはAndroidベースで実装されており、IMS障害にデータ通信も巻き込まれた可能性が高い。
au回線の不具合のため全ての乗客のバスのモバイル決済不要って🥺
— Kiyomi. (@felizdia92) 2022年7月2日
無料になってしまった💦 pic.twitter.com/QK6aJjnRpq
https://twitter.com/clouded19/status/1543428565143658497?s=20&t=0TT7M_kzIFMfxaBLg28-4g
au復旧したっぽいヽ(´▽`)/
— こにたん@4.14日本武道館 (@clouded19) 2022年7月3日
自販機でコーヒー買えたよ!
CokeOn使えないのはもしかして、自販機の中の通信auだったりするのかな。スマホのほうの決済はうまく行くけど
— ambasad (@ambasad) 2022年7月3日
タイムズ、au回線だったか、、、 pic.twitter.com/rDPzyVnyxP
— shao / 澤田 翔 - デジタルネイティブ企業のコーポレートIT支援 (@shao1555) 2022年7月3日
キッズ携帯
個人的にはこれが一番ヤバそう。キッズ携帯はデータ通信がなくてIMSのみを使用しているため機能が全滅する。
通話ができない、SMSが送れない、位置情報確認ができないことによって、防犯ブザーがなったときの自動通話や、写真・位置情報の送信ができなくなるなどの防犯機能がほぼ無効化されてしまう。
IMSが落ちている時は子供を一人で外出させないなどの対応が必要になりそうだが、子供が学校に行っているときなどの日中帯に障害が起きたときには防ぎようがない。
- 通話できない
- SMSできない
- 位置情報確認(安心ナビ)できない
- 防犯ブザー発動時の位置情報送信・SMS通知が機能しない
auの通信障害いつ治るの🙁?
— 8y🎀6y🎀1y🚗 (@M59165685) 2022年7月2日
子どものキッズ携帯防犯ブザーを引っ張ったら私に自動で電話がかかるんだけど、キッズ携帯の防犯ブザー引っ張ったら通信出来ませんって出たよ😇
緊急の時だったらと思うと本当困るし何のためのキッズ携帯なのってかんじ😇
きょうはauの電波障害で我が家はみんな電波障害。
— いしげまやこ (@stone_underson) 2022年7月2日
LINEで連絡は取れるけど、塾に行った息子と連絡が取れずちょっと困りました。
(息子はキッズ携帯だからLINE使えず)
我が家のリモコンも電池切れじゃないのに急に効かなくなるし、みんな暑くてやる気ないのかな。
南の島の人は働かないっていうし…^^;
auの通信障害、流石に酷い。自分は丸一日全く使えてない。そして息子のキッズケータイはau。今日もし仮に外出中に息子と連絡とったり位置情報確認したくなったりした際に障害が発生していたら…と思うと恐ろしい。キッズケータイはキャリア冗長が出来ないのも悩ましい。
— アザラシおっさん (@azarasyossan) 2022年7月2日
IMSがダウンしても大丈夫な機能
緊急地震速報
緊急地震速報はETWSなのでIMSがダウンしても大丈夫。 LTEなETWSではCBCからMME、eNB経由でUEに送信される。今回はMMEに障害はなかったのでセーフ。
現在、通信がしづらい状況についてお問い合わせを多く頂いており、窓口が大変込み合っております。
— au (@au_official) 2022年7月2日
ご迷惑をおかけし、大変申し訳ございません。
なお、緊急地震速報の受信については、影響ございません。
仕様・プロトコル
LTEのIMS
SIP/VoIP Security Audit | Solutions & Services | NextGen, Inc.
IMS Registration
IMS Registrationができなくて通話・通信ができないという話をしてきたが、この手順のフローは1ページに書けないぐらい長い。ざっくりのステップが以下の5つであるが、端末であるUEの他にP-CSCF、I-CSCF、S-CSCF、HSSという4つのプロバイダ側の設備(ネットワークファンクション)が連携して動作する。
どの設備がどこにどれだけの数配置されていて、どれだけの性能・キャパシティを持っていて、といったことを考え始めると今回の「輻輳」といったものに対処することがいかに難しいのかは想像しやすいと思う。
(1) GPRS Attach: The terminal registers to the GPRS Network.
(2) PDP Context Activation: An IP address is assigned to the terminal.
(3) Unauthenticated IMS Registration Attempt: The terminal attempts an IMS registration but is challenged by the IMS network to authenticate itself.
(4) IPSec Security Association Establishment: The terminal establishes a protected session with the IMS network.
(5) Authenticated IMS Registration: Registration is reattempted. This time the terminal is successfully authenticated and accepted.
以下の画像はIMS Registration Flowの4ページ中の2ページ目だけ抜粋したものである。
https://www.eventhelix.com/ims/registration/ims_registration.pdf
ETWS
LTEにおけるETWSではCBEが要求を出してCBCからMME、eNB経由でUEに送信される。このためIMSの障害の影響を受けない。一方的に情報を送るだけのシステムなので簡素化できている。
その他情報が分かり次第&勉強でき次第随時追記・加筆修正します。
https://twitter.com/omusubi5g/status/1543205131239321600?s=20&t=P05NemvKgsih4NdvWEWWww
https://twitter.com/maganori/status/1543022606659768320?s=20&t=P05NemvKgsih4NdvWEWWww