プロフィールはコチラ アクセスランキングに参加しています。クリックお願いしまーす! |
飛行機も飛ばない
これから、SEを目指す人のために、
今回の教訓・・・。
一通り、トラブルの全貌がみえてきて、今は修復作業に追われてるけど、
どっか、ひといきついてきて、コーヒーを飲む余裕も垣間見える今日このごろ(笑)
今回のトラブルは、
先日、ANAで起きたトラブルと同じ原因と思われ・・・。
詳しく発表されてないけど、ANAで起きたシステムトラブルも
非常に簡単なことで起きた。
原因を聞けば、「えーー!!たったこんなことで飛行機が飛ばなくなるの!」と
言うと思う。
ボクも、こんなことで、多岐にわたってトラブル連鎖が起きるなんて想像してなかった。
けど、損害は、あと数時間で莫大なものになるところだった。
億単位・・・。
ボクの年収なんて吹っ飛んじゃう・・・。
その原因が、たった1つの不注意から・・・招いたヒューマンエラー。
それで億単位の損害が出るんだから、コンピュータって怖いよ・・・。
教訓です。
SEならば、というかコンピュータに携わるものとして最低限の注意。
1 「使用されているソフトの期限、SSLの更新期限、ドメインの期限を把握しておくべし」
ANAのトラブルもSSLまたはそれに近い認証システムの有効期限が切れたことが原因。
ANA発表によれば、データセンター(東京都大田区)にある管理サーバーの認証機能が期限切れになってしまい、同サーバーに接続している搭乗手続き端末が起動しなかったことが原因と。
それだけで63便もの飛行機が欠航・・・。358便に遅れなどの影響がでて7万人に影響した。
2 「ファイルの容量、ハードディスクの残量は、把握しておくべし」
容量オーバーになってしまうと、ありとあらゆるシステムが動作できずに、停止。
最悪、全システム停止&データの欠損を招き、とりかえしがつかなくなる
ボクの会社で起きたトラブルも、この2点の注意力があれば、
起きなかったかもしれない。
ボクだけの責任じゃないけど、
チーム全体、会社全体の責任。
重く受け止めて、まだまだ復旧作業は続く・・・。
まだ会社
頭いたくなっちゃうトラブルだヮ・・・。
ただ根本は、すんごく単純なことでエラーが出てるの。
その単純なことが原因で、
さまざまなシステムに問題が生じるってことが
ほんとうよくわかった。
たとえば、コンピュータの西暦が2桁時代だったころ。
2000年が来たら、コンピュータは00年、1900年と認識し、誤作動するって
世界中に恐怖を巻き起こした「2000年問題」
西暦の認識違いでとんでもない誤作動する。
一昨日、昨日、今日と起きているトラブルもそういう感じ。
事前に対策していれば、こんなことは起きなかったかもしれない。
起きてから誰でもいえることなんだけどさ。
その当時じゃ、想定外のトラブルなんだよね、きっと。
ってなことで、まだ会社です。
SE(システムエンジニア)の職の弱いところは、ここなんですよね・・・
トラブルがあると、家には、帰れません・・・(泣)
体重測定結果&写真公開は、今日(金曜日)に順延して、
同じく午後10時?の公開予定とします。
よろしくおねがいしまーす!