TOP > IT・テクノロジー > システム過負荷でなぜATMにトラブルが? みずほ銀システム障害、運用面の課題あらわに - ITmedia NEWS

システム過負荷でなぜATMにトラブルが? みずほ銀システム障害、運用面の課題あらわに - ITmedia NEWS

106コメント 2021-03-02 07:13  ITmedia

2月28日に発生したみずほ銀行のシステム障害では、想定以上のデータを処理したことでシステムに大きな負荷が掛かり、取引やATMの機能が制限され障害としてあらわれていた。

ツイッターのコメント(106)

キャッシュカードはともかく、通帳も「枚」なん?
>「今回の障害の問題は運用面にあった」

↑実はこれかなりやべーやつ
本当にみずほやばいと思うの
昔、証券会社のシステムに関わったことあるけど、エビデンスのキャプチャとかが多すぎて金融系システムには関わりたくない思った。
>みずほ銀は27日、1年以上動いていない定期預金口座のステータスを「不稼働」に変更するデータ更新作業を行っていた。処理したデータは45万件。
自前のシステム会社作って運用するしか無いと思う。(開発までやれとは言わないけどね。
頭取「システム構築は成功している。運用面とハード面で不十分があった」

まー確かにそうだけど… システムも本当に成功してるんか?って不安は残るよな😅
データ移行を月末に行う危険性は現場は当然認識しているわけで、何らか上からの圧力があったんだろうな。某銀の現場軽視は2002年から変わってないんで4度目ありえるぞ。
他行のATM使うことになった人に
手数料を返します、は、いいけど、
月末支払いできなくなった人へはどうするのだろう?
月末とか素人目にも走る処理増えると思うけど、そのタイミングで(即時性が必要なさそうに見える)動いていない口座のステータスを変更しに行くの怖ない?
障害原因と関係ない所を切り離すフェールセーフ実装してる時点でminoriは問題無いとは言えないと思うんだが。取引フロー制御ってどこのフレームワークだろう?IBM?
これについてプログラムをカナダで書いている友人が、面白い指摘をしてくれた。
業界人のサンドバックと化した詳報
システムのバグなどの問題かと推測してましたけど😅

これはだれか運用側が止めなかったのでしょうか😅
タコ足配線でもしてたんだろ
通帳廃止を勝手に推し進めて、結果としてATM止めたと。救いようないな、上層部。
性能的に大丈夫かどうか以前に、勘定系の月末処理とそれ以外の大規模な作業を並行してやるのは色々と厳しい。タイミングずらせなかったのかな。
Final Cut Proで作業してたら挙動不審になって、あ、内部ストレージ不足か⁉︎といつも慌てて外部に移しはじめる私🤡
みずほのトラブルって、まさかそんな私レベルの原因ってことなの?
この内容ってことはホストかなあ。
異常時動作としてカードや通帳を飲んだまま停止したのが疑問だったんだけどそれは誤動作だったと
システム屋には「運用でカバー」って魔法の言葉があるんだぜ?
「データ更新と月末処理がバッティング」
そもそもシステム設計の時点からしくってるのか、試験関連工数がっつり削ってるのか???
にしても、ここ結構システムトラブル多いよなー
時間外で更新すればよいのに
できないんかな
(ヽ´ω`)今わかってるところを読んでるだけでも先に期待できなそう…
藤原頭取は「過去2回の障害の教訓については、システム構築、運用、リスク管理についてしっかり対処してきたつもりだ」 マジでー
>データ更新と月末処理がバッティング
>ATM誤作動は“リスク軽減”の結果
→”システムに十分なデータの空き容量が必要”な作業を、通常処理が増える月末に突っ込んだPMが悪いな

みずほ銀システム障害、運用面の課題あらわに-ITmedia NEWS
頭下げて詫びればいいと思ってんだよな💧
なんで普段からTwitterもインスタもしないのかLINEも見ないのかそこが不思議なだけなんよ?💢
それで少しでも気づければトレンド入りして拡散されて気付かないハズがないだろ?💢
今さら謝罪シーン再現されてもただのパフォマにしかw
みずほって20世紀の名門三行が合併したやつだけど、未だにあちら立てればこちらが立たぬ的に3システムを統合し切れてないのかな?
起きるよね、こういうことは。
「今回の障害の問題は運用面にあった」って、観点がずれてる気がするんだが。
データ量が想定より多くなった時に、更新処理が止まる設計になってるのがあるべきでは。「1年以上動いていない定期預金口座のステータス変更」なんて、止まってもクリティカルじゃないでしょ。
なんか攻撃でもされたのかと思ったら過負荷ですか。。

過負荷でATM誤作動が起きるというのは?だけど、過負荷で一部機能を制限した中に口座のチェックシステムが含まれていてということかな。
つまり、システム上の障害運用は正常に動いたということか?

見積もり甘くて月次より1.5倍以上のデータ盛っちゃって負荷で落ちた→全体停止を阻止するためATM制限!
→処理不完全のため通帳カードを一時的に取り込みが誤作動起こしちゃった
ATMがカード食ってしまうのは最悪。
だよな、「なぜATM?」と疑問に思うよな:
非機能要件はいつも計画に見積もられ忘れる。そして、横連携がないと非機能要件も見積もれない。自分が反省すべきこともいっぱい。
要約「テストはしてたんすよ!同時に動いてる処理の考慮が抜けてただけで!」

「下請けの所為にしないところに好感が持てる」って意見を見たけど、出来る訳ないよなぁ。性能要件やし
フェイルセーフが働いたのが原因だった模様…🧐
“1年以上動いていない定期預金口座のステータスを「不稼働」に変更するデータ更新作業を行っていた。処理したデータは45万件。この作業を行うにはシステムに十分なデータの空き容量が必要だという。”

僕はストレージが勝手に伸びる世界に住んでいます。お疲れ様です。
>ATMには不正利用の食い止めや、不完全な処理の確認のため、通帳やキャッシュカードを一時的に取り込む機能がある。これが誤作動した。
やっぱりそうか。
「リスクを最小限に食い止めるためにATMの機能が制限され、障害となって現れた。ATMには不正利用の食い止めや、不完全な処理の確認のため、通帳やキャッシュカードを一時的に取り込む機能がある。これが誤作動した。」
誤作動ではなく、正しく機能したのでは?
>銀行スタッフの対応の遅さを批判する声も上がっていた。

なんも関係無いけど、この精神が全員の仕事量を増やす原因だと気づいた。もっと余裕持って生きたい。
要件通り作られていたならシステム屋は悪くない。
本当にシステム統合した方影響ないんでスカねぇ… -

Oracleとして、Undo領域、temp領域が不足したとか?

引用
過去の大障害に比べれば遥かに被害は小さいし本格稼働からまだまだ日も浅い事を鑑みればそこまで大騒ぎする話ではないと思うけど、重要なバッチが集中するであろう月末に不要不急(の様に記事からは類推される)かつ初物の処理をあえて実施するというリスク感覚は理解に苦しむ
もうメインバンクじゃないからいいですけど、みずほ銀行はこういうトラブル多いですね。
→(定期預金の)「データ更新作業自体は今回が初めてだった」(記事中)、ということは、月1回とか年1回とかの頻度ではないんですね。意外。
ATMを止めなければ、もっと酷いことが起こってたのね...😮
パワーワード。
過去2回の大規模障害を経てのシステム構築は「成功している」

»
もっと見る (残り約56件)
 

いま話題のニュース

もっと読む
PR