【アナデン】2/19 障害

お役立ち

2/19 深夜頃から発生している障害について、公式 Twitter のつぶやきをまとめました。

スポンサーリンク

つぶやきまとめ

2/19~ 障害状況
  • 2/19(金)
    23:59
    初報
  • 2/20(土)
    0:39
    続報
  • 5:55頃
    AWS 大部分の復旧

    Amazon Web Services(AWS)大部分の復旧完了

  • 11:17
    不具合解消報告

ログイン状態のまま日付跨いで、ログボ貰おうと思ったら通信障害でアプリ再起動、認証エラーコンボでした。
WFS のお問合せページも「504 Gateway Time-out」ですし、障害範囲が広いんでしょうか。

お早い復旧をお待ちしています……
2/20 8:00頃にはログインできました。

原因?

アナデン公式の発表ではありませんが、Amazon のクラウドコンピューティングサービス「AWS」の大規模な通信障害の影響とする記事がありました。

403 Forbidden

12:54 PM PST (5:54AM JST)

日本時間 02/19 11:01 PM から、AP-NORTHEAST-1 リージョンのうちの1つのアベイラビリティーゾーンの一部の区画で室温の上昇を確認いたしました。

日本時間 02/19 11:03 PM から、室温が上昇した結果として、一部の EC2インスタンスが影響を受け、一部のEBSボリュームではパフォーマンスが低下しました。根本的な原因は、影響を受けたアベイラビリティーゾーンのセクション内の冷却システムへの電力の喪失であり、すでに回復済みです。

日本時間 02/20 03:30 AM までに、電力は冷却システム内のほとんどのユニットで復旧し、室温は通常のレベルに戻りました。

日本時間 02/20 04:00 AM までに、EC2 インスタンスと EBS ボリュームの回復が始まり、日本時間 02/20 05:30 AM 時点で、影響を受けた EC2 インスタンスと EBS ボリュームの大部分は通常通り動作しております。一部のインスタンスとボリュームは、イベントによって影響を受けたハードウェア上でホストされていました。引き続き影響を受けたすべてのインスタンスとボリュームの復旧に取り組み、Personal Health Dashboard を通じて、現在も影響を受けているお客様に対し通知を行います。即時の復旧が必要な場合は、影響を受けているインスタンスまたはボリュームを置き換えていただくことをお勧めします。

AWS Service Health Dashboard – Feb 19, 2021 PST
「Amazon Elastic Compute Cloud (Tokyo), [RESOLVED] インスタンスの障害について | Instance impairments 」から抜粋