やっと分かって来ましたね
Jun
27
通常なら、バックアップデータから元のデータを復元することで一両日中にウェブサイトなどは復旧する。バックアップデータは、本番環境とは違うサーバー、あるいは外部記憶装置に定期的にとっておくことが基本だ。ところがファーストサーバでは事情が違った。
ファーストサーバが25日未明に公開した「事故原因」。「本番環境」と「バックアップ環境」のサーバーが別に見えるイラストは「ミスで、修正作業中」(同社)
ファーストサーバにおけるセキュリティ対策では、3つのHDDに同じファイルをコピーしていた。1つは「本番系」。もう1つは本番系のHDDやシステムに不具合が生じた時、即座に切り替え、正常稼働を続けるための「待機系」。もう1つが、毎朝6時に本番系のデータを丸ごとコピーしておく「バックアップ系」だ。この3つが、すべて同じサーバー内に同居していた。
あろうことか、ファイルを削除してしまう更新プログラムのバグは、本番系、待機系に加え、同じサーバー内にあるバックアップ系のHDDまでをも消去するという代物だった。
データセンターの場合、ディスクにはここで説明されたように本番系、待機系(レプリケート)、バックアップ系の3つがある。これは我々も同じ。データ量が多いので昔のようにテープのような別メディアにバックアップを持つことは考えにくい。また、スピードを考えると待機系やバックアップ系を本番系を同じハード内に持てばスピードは早くなる。外に出せば言うまでもなくネットワークを使うことになります。ですからファーストサーバでは内部に持つことにしたのだと思います。
ここまでやってコストセーブしていたのですか。知りませんでした。すごい綱渡りですね。我々も本番系、待機系、バックアップ系の3つを持っていますが、ハードだけが違うのではなく場所も違います。そして価格はファーストサーバさんより安いです。
参考: http://www.nikkei.com/article/DGXNASFK2600L_W2A620C1000000/