TOP > IT・テクノロジー > AWS障害、大部分の復旧完了 原因は「サーバの過熱」 - ITmedia NEWS

AWS障害、大部分の復旧完了 原因は「サーバの過熱」 - ITmedia NEWS

455コメント 登録日時:2019-08-23 22:24 | ITmediaキャッシュ

米AWSは午後8時18分、クラウドサーバの復旧がほぼ完了したことを明らかにした。制御システムの障害により、サーバの温度が上がりすぎたことが原因だったという。...

ツイッターのコメント(455)

この騒動、絶対、 amazon music HDを構築する為にやらかした案件だと、以前から勘ぐってます。例えば、音楽データをSD→HD or Ultra HDにデータベースを上書きしたなど・・・
// 私の周辺だと駅メモが阿鼻叫喚だった。
リアルサマーウォーズ恐るべし。
やはり怖いよねー、クラウドサービスは。
三日前に消滅都市とかログインできなくなったのあれか。AWSの障害のせいか。
まああることだけどさ、、、
クソがっ!(byよしこ)
大元は空調システムのbugとか。
アマゾンでこういうことが起きるのは珍しい?
成長痛で現場の無理が見過ごされてる?
一つのAZでの障害とのことだから、マルチAZであれば、マルチリージョンでなくとも大丈夫だったてことだよね?
逆に障害起きたところはマルチAZやってなかったのか??
AWS障害の原因はサーバー過熱だそうです。
まぁ解決してよかった(*^^*)
…電話が何通か掛かってきたのは内緒やで笑
アマゾンの火事も鎮火したとか
今後の予防策として過熱防止はますます強くなるであろうと思われる

NEWS)
これかなりの時間障害続いたけど、色々大丈夫なのかな
23日の時点で複数のメディアに掲載され、記事の中でAWSの公式発表もされていると思うのですがこれではダメなのでしょうか…
サーバーの加熱ということはやはりアマゾンの火災と関係が…
個人向け高性能PCでも「放熱不良で青画面停止(Windows)」が起こりますが、それがデータセンターのサーバーで発生するとこうなるって事です。
AWS(Amazon Web Services)の障害は熱暴走が原因だっのか。以前アマゾンの営業マンが絶対に止まらないとプレゼンしていたけど、あり得ない話だと聞いていた。世の中、理屈通りには動かない。ハードは壊れるし、ソフトはバグが出るし、人間は必ずミスる。原発もだ。
まさかの熱が原因(゚∀゚;)
大きな問題にはならなかったけど、ある意味、AWSというサービスレベルでの単一障害点。
マルチクラウドにするのもアレな感じがするけど。
サーバも熱中症になるんだな
けんちゃんがいってたのこれかw
熱計算出来ててもダメな時はダメと。冗長性含めて器は大きい方が良いね。
…って事は、週明けの出勤日、阿鼻叫喚の対応作業に見舞われてるエンジニアが、数多くいる、と。

※ECサイトのサポートエンジニアは、緊急休出だったんだろうけど。
Amazonにまで勝利する俺たち日本の暑い夏!(違
尼鯖「あつい」
AWSって業界最大手でしょ?(多分)それでも暑さで死ぬか……
恐ろしい😨

Discover(Google)から
一瞬、世界の全リージョンでサーバが加熱で落ちたんか?んな訳なかろと思ったが、勿論そうだが全リージョン跨ぎにするのって料金高いんだよな、確か。って思い出した。>
復旧してよかったー。月曜日にシステム確認するけど、データ元どおりでなかったら泣くな。
金曜のAWS障害はいろんな意味で大変だったが、制御システムの障害により、サーバの温度が上がりすぎたことが原因とのこと。 / NEWS)
うーん、これ現場に居た人最悪だろうなぁ
暑い中で次々と落ちて行くのを見守るしかない恐怖
自分もiPhone iPadのアプリの一部が一時的に使えなくなって楽しませてもらったよ…原因究明できたなら再発防止徹底して頂きたい。けしからん!!
発熱が原因とは。案外、対策やテストの難しい分野なのかもしれない。ファイバーチャネルを抜き差ししたり、フェールオーバークラスタ、サーバーの電源喪失、ネットワーク瞬断テストなどは行うけど、確かにマシンルームの空調落とすテストはやったことなかったかも。
え、AZの障害だったの?
要は熱中症?
AWS 障害、原因は冗長化冷却システムの障害による「サーバの加熱」とのことだが、ここまで社会的影響が出るのだから、サーバ毎に緊急冷却システム(ECCS = Emergency CPU Cooling System)を設けるべきではないか。
グリージョも過熱でフリーズするからねー
昨日、多くのスマホゲームで発生していたサーバー不調の原因は冷却システムの障害による加熱状態か。
この文章からだと問題は冷却システム?EPYCの発表後だけにCPUが気になったりしますけど…。
Googleはこういう話を聞いたことないから偉大だな。
なんで仮想環境なのに過熱するんだよ!笑
そこそこエグイな。この発表。

そこそこエグイな・・・。
東京リージョンのデータセンターの問題と見えてしまうか、物理ホストがイケテナイみたいなことなのか?
やっと回復ですか
復旧までもうしばらくかかりますね
過熱ですか
久しぶりに聞きました
お母さんがコンセント抜いたんじゃなかったんだね?
📝
👉

◾️いいね・リツイートをして,フォロワーとしてもお友達としても仲良くして頂けると幸いです。プロフィールもご覧あれ…
サーバ加熱によるシステム異常ですか。待機システムも同加熱被害範囲とありアマゾンにしては情けないぐらいの超初歩的の失敗と言う。金けちったの?
冷却システムのトラブルて
リリース出てたのか。これ以上の内容は公表されない感じかな?:
昨日のAWSトラブル
冷却システムの障害で
サーバーの温度が上がりすぎた事が原因

そういえば、うちの車も冷却ファンの故障でオーバーヒートした。。
ホントに炎上してた
これ、該当インスタンスがある人は変えた方がいいってことかな?
社会が改めて企業のクラウドサービスに依存しているというのを改めて見せつけられた事案。
便利さにもいろいろ難しい点はあります。
熱だったのかー
過熱かぁ…
AWSのクラウドサーバー使ってるアプリが結構あったのが今回でよく分かりましたがw
ほぼ復旧してて、してないところに限って熱いイベント開催中とか😅
@OyRevo たしかにネットニュースあんまり見かけないですね()

いちお復旧したみたいですよ♪
こう言うのを読むと、なんぼクラウドや言うても、根本的にはハードウェアなんやなぁと再認識しますわな。
世界中のお前ら、サーバ酷使しすぎ😰
マジこまった
1AZだけやったん?
マルチAZにしなかったアホベンダは、どこのどいつだい?
なかなか痺れる原因だったな。
データセンターの空調が死ぬという可能性はレアケースすぎる。
まさかの熱暴走だったのか…
こういうケースは完全にサーバが死なず、半死状態になり、一番対処が難しい /
サーバの加熱ってタイトルだけ見てアホかと思ったけど制御システムか😅
AWSをクラウド化しなきゃって言ってる人いて笑ったわwww
制御システムでエラーが出てたなら仕方ないわな、タイトル見て「え、そこ対策してないの?」ってマジで思ってしもうたw
熱中症だったか。気をつけないと危ないぞ。
温度監視も大切なんだな、と
お盆明けで調子狂っちゃったのかな?
よくわからんけど多分うちのEC2インスタンス、顧客の対応を必要とするインスタンスだ
やっぱ物理サーバは脆弱だな
やっぱクラウドは南極リージョンが安全だね♪
マジでサーバが熱中症起こしてたのか。
サーバくらいぶっ潰す程の猛暑なのか、この国は(違う
冗長化してたのにダウンしたとは対策が大変そう。
サーバの温度が上がりすぎたことが原因
冷却システムの故障でサーバ過熱が発生。paypayやユニクロ、ゲームなどサーバ障害による影響範囲は広かったね。
やっぱ暑いのはダメだって
東京暑いからー、夏ならではということと何か変更でもしてたのかな。
冷却ギリギリに抑えたり…

AZ内の制御システムに問題が発生し、複数の冗長化冷却システムに障害が起きたという。結果として、AZ内の少数のEC2サーバが過熱状態となり
バックアップは無かったんですね。そこまで連続運用性能は重要とは判断されてないのかな。→
リプレースしろってwww
クラウド最高やなw
本日一番の「ええええーっ!!?」なニュースinわが家
ね・熱暴走・・・・(^_^;)
これは大打撃だ。
プライベートクラウドと分散した方が吉かな。
DC運用が当然どこかは知らないが、温度上昇の初期対応って、扉開けて扇風機回すぐらいしかないから、ほんとお疲れ様だ。
"AZ内の制御システムに問題が発生し、複数の冗長化冷却システムに障害が起きた"
AWSの障害の原因、サーバーの熱中症だって。
やっぱり熱中症はこわい。
冷却システムが冗長化してあったものの故障→サーバ温度上昇(熱暴走?)→障害発生という流れかな?
AZ1か所でそんな影響でちゃうんだ? //
ほとんど復旧したみたいだけど、AWSですら障害発生するのですね?クラウド型電子カルテもメドレーはAWSを使ってるけど、障害なかったのかな?
復旧完了? うちのクラウドはまだあかんぞ。隕石でも落ちたんか?
商用で使ってるならAZ分けてるとこが多いはず…
初歩的な……
リージョン全体ならともかく、az1つ落ちただけで多くのサービスに影響が。特に決算や取引といった止まってはいけないものもありオドロキ。

もちろんマルチに対応させるべきですが、コスト面なども考慮するとサーバレス...
復旧さすがに早いね。社内のサーバーだとなかなかこうはいかないなあ。どこまでクラウドにするかだけど、まだまだ外出し出来るところはいっぱいある。
AWSが落ちるほど暑い東京🥵
こんなところでオリンピックをやってもいいのでしょうか?(違
もっと見る (残り約355件)

記事本文: AWS障害、大部分の復旧完了 原因は「サーバの過熱」 - ITmedia NEWS

いま話題の記事