TOP > IT・テクノロジー > AWS、複数のアベイラビリティゾーンで稼働していたアプリケーションでも大規模障害の影響があったと説明を修正。東京リージョンの大規模障害で追加報告 - Publickey

AWS、複数のアベイラビリティゾーンで稼働していたアプリケーションでも大規模障害の影響があったと説明を修正。東京リージョンの大規模障害で追加報告 - Publickey

63コメント 登録日時:2019-08-29 03:16 | Publickeyキャッシュ

2019年8月23日金曜日の午後に発生したAWS東京リージョンの大規模障害について、AWSは追加の報告を行い、複数のアベイラビリティゾーンで稼働していたアプリケーションでも障害の影響があったことを認めました。 下記は大規模障害の報告ページで......

Twitterのコメント(63)

公式に出たようだ。
Aws、複数のアベイラビリティゾーンで稼働していたアプリケーションでも大規模障害の影響があったと説明を修正。東京リージョンの大規模障害で追加報告
盛り上がってきた。
うーむ。稼働させていればお金は倍払うことになるのできちんとした説明がほしいところ。
これって、EC2に載せたWebアプリがステートフルの場合で、他のAZにセッションレプリされてなくって〜 とか、そういう話だよな?

AWS、複数のアベイラビリティゾーンで稼働していたアプリケーションでも大規模障害の影響があったと説明を修正。
AWS Multi AZ 対応していても障害は避けられないことがある、とのことで、そのときは諦める😇

AWS復旧後にスムーズにサービス復旧できるかに全力を注ごう👨‍💻
オフィシャル的な対応策を提示待ちしつつ、こっちはマルチリージョンやマルチクラウドとかをサービス提供責任、法務コンプラ、手間、時間、リソース、お金その他とご相談。【Publickey】AWS、東京リージョンの大規模障害で追加報告
Twitterで報告している人もいたけれど、やはりマルチAZでもダメだったらしい。
これ詳細情報の開示を希望する(そうすればマルチAZの設計tipsになるとおもうので) →
この対応は善くないなあAmazonさん /
ようやくMulti-AZ環境でも影響が起きたことを認めたのか。個別対応するってAWSにしては雑な対応な感じが >
AWS、サポートが変なことを言うことは普通にあるので、ちゃんと自分で検証する能力が必要だよね。
複数AZで障害ってことは、単純にマルチAZ構成にしているから単一障害には耐えれますって理論が通じないってことか。。。

AWS、複数のアベイラビリティゾーンで稼働していたアプリケーションでも大規模障害の影響があったと説明を修正。東京リージョンの大規模障害で追加報
そうそう、うちマルチAZだからなんで影響出たのかが不思議だった
当初発表より大きかった障害の話。ネットでも議論が活発になっている感じです。 /
公式でもMultiAZで対処できないケースがあったと認めたのね。どのようなケースで問題になったのか興味がある。
表に出せる以外のものが原因なのだと思う クラウドのリスクですね>AWS>「どうすれば今回のような障害に対応できるシステムを設計し得るのか?」について、多くの議論や意見が表明されており、真剣なAWSユーザーであれば誰でも、そのオフィシャルな答えを求めています
リージョン分けてDRってこった。やっぱサーバーレスか??
>'真剣なAWSユーザーであれば誰でも、そのオフィシャルな答えを求めています' ">"
データ見てる感じウチは然程大きな影響になってなかったけど、ALB側5xxとか一体どうすれば・・みたいな感情はある
当日ALBとかの利用者から報告があったマルチAZでも影響があった件を公式に認めたか >
「複数のAZで稼働していたアプリケーションであっても障害の影響を受けたと説明。どうすればこの影響を防ぐことができたのか? については、個別対応するという歯切れの悪い説明になっています」 / “AWS、複数のアベイラビリティゾーンで稼働していたアプリケーション…”
マルチクラウド運用はかなり厳しいし辛い。 /
AZも信用できないって再計画大変ね /
中途半端にサーバが落ちた状態でどう対応するかは難しい問題だねえ。
やっぱ時代はコンテナやで
うーん、やっぱり複数AZでも影響でていたのか。
Multi-AZの意義とは(哲学)
アベイラビリティの計画は悩ましい。。
Multi-AZでも障害はやっぱり起きてたよね
そりゃそうだよね、と。
“ネット上では「どうすれば今回のような障害に対応できるシステムを設計し得るのか?」について、多くの議論や意見が表明されており” / “AWS、複数のアベイラビリティゾーンで稼働していたアプリケーションでも大規模障害の影響があったと説明を修正。東京リージョンの大規…”
説明が追加された事自体は朗報。個別に問い合わせないと詳細な情報を共有してくれない点については以前からそうなので(独自エンジンのクラッシュ情報もアナウンスしない)、早めに問い合わせて行きましょう💪 / “AWS、複数のアベイラビリティゾーンで稼働していたアプリケ…”
先日の東京リージョン大規模障害後に、AWSが「Multi-AZにしてALB使ってれば可用性を確保できてた」という旨のリリースを出し、利用者から「いや、ALB + WAFの組み合わせでInternal Server Errorが出ていたよ?」とツッコミを受けてた件について公式に追加報告があった模様。 /
個別対応か〜
ウチもマルチAZには当然しててアプリのログは正常だったが前段のALBがたまにエラー吐くというゾンビ状態でした/AWS、複数のアベイラビリティゾーンで稼働していたアプリケーションでも大規模障害の影響があったと説明を修正。東京リージョンの大規模障害で追加報告-
Multi AZでもだめだったかー
まあやっぱそうだったよね
個別のケースはまだ調査中なんですねー
実際にあったものは仕方がない
自身のシステムのRLOをどこまで考慮していたかっていう話じゃ無いのかなぁ。
ALB 絡みの話が追加されていた。ユーザ側がどう対応すれば回避できるのかまで説明が欲しいところ。
おっとー?
AWS、複数のアベイラビリティゾーンで稼働していたアプリケーションでも大規模障害の影響があったと説明を修正。東京リージョ… - はてなブックマーク - 人気エントリー
マルチリージョンにしたつもりがなってない可能性があるのは注意が必要だな。
ALB&WAF、ALBをスティッキーセッションで使う場合にマルチAzでも障害があったらしい。ふーむ。
ですよね
この結果さらに改善されればそれでいいでしょ
MAZでもダメとかキツイな…
ううむ。やはりロードバランサーも影響ありだったか。 /
予期せぬ挙動にはなるだろうなあ。 /
マルチリージョンしかないのか? /
@cjmjcxvxjtr 公式もマルチAZも影響ありに修正された模様
"AWSは追加の報告を行い、複数のアベイラビリティゾーンで稼働していたアプリケーションでも障害の影響があったことを認めました。"

あ、そうだったんだ。AWS使ってるところ多いし、障害に強いインフラ構築の仕方についてまだまだ議論されそう。
チェック | AWS、複数のアベイラビリティゾーンで稼働していたアプリケーションでも大規模障害の影響があったと説明を修正。東京リージョンの大規模障害で追加… -
どうやらマルチAZでも障害を完全に回避できたわけではないようだ。
Multi-AZ でダメ🙅‍♀️となると Multi-Region ってことかいな?となってしまうから、確かに「Multi-AZ とは」となるのは心情としては仕方ない感。

AWS さんももしかしたら「本当のことが言いづらい」のかもしれないし、難しいところだよねー。
以上

記事本文: AWS、複数のアベイラビリティゾーンで稼働していたアプリケーションでも大規模障害の影響があったと説明を修正。東京リージョンの大規模障害で追加報告 - Publickey

関連記事