レンタルサーバ大規模障害、その原因と対策 前編
2012年6月、データセンターとホスティングサービスで大規模障害が発生しました。ひとつは富士通の「館林システムセンター」、もうひとつはファーストサーバの複数のサービスです。
特集
特集
三重の対策がすべて機能しなかった「館林システムセンター」
6月7日、複数の銀行で同時多発的にシステム障害が発生しました。具体的には、東京スター銀行のすべてのATM、サークルKサンクスの子会社とりそな銀行が運営するATMの一部、ソニー銀行のすべてのシステム、「ニフティクラウド」の一部サーバ、スクウェア・エニックスのオンラインゲームなどが長時間にわたって停止しました。これらのサーバが富士通の「館林システムセンター」にあったのです。
この障害に関する情報は少ないのですが、ニフティクラウドの報告書から原因がある程度わかります。原因は同センターの無停電電源装置(UPS)の故障で、これにより約7%のサーバに電力が供給できなかったことだといいます。同センターでは、UPSに障害が発生すると冗長系のUPSが作動するようになっており、すべてのUPSが停止した場合はUPSを介さずに電力を供給するようにしていました。いわば三重の対策を実施していたわけです。
原因となったのは…
※本記事は有料版に全文を掲載します
《吉澤 亨史( Kouji Yoshizawa )》