クラウド運用管理

3分でわかる!AWSにおける障害対策【後編】~もしものトラブルでもサービスを継続するために~

前編では、Amazon Web Services(以降、AWSと略す)における4つの障害対策のうち、「Amazon CloudWatch(監視サービス)」と「Auto Recovery(HA機能)」をご紹介しました。
後編では、「AWS Backup(バックアップ)」と「HAクラスタソフトウェア」について解説します。前編をご覧になっていない方は、ぜひ「AWSにおける障害対策【前編】~もしものトラブルでもサービスを継続するために~」をご覧ください。

【目次】

1. 障害対策の種類

AWSにおける障害対策には、次の4種類があります。このうち、前編では「Amazon CloudWatch(監視サービス)」と「Auto Recovery(HA機能)」について、後編では「AWS Backup(バックアップ)」と「HAクラスタソフトウェア」について解説します。

前編
  • Amazon CloudWatch(監視サービス)
  • Auto Recovery(HA機能)
後編【本記事】
  • AWS Backup(バックアップ)
  • HAクラスタソフトウェア

1.1 AWS Backup(バックアップ)

データを退避していれば、トラブルが発生しても過去のデータに巻き戻すことができ、結果、RPOを短くすることができます。フルマネージド型のAWS Backupでは、Amazon EBSスナップショット、Amazon RDSスナップショットなど、各サービスの既存バックアップ機能をサポートしており、例えば、1日1回深夜0時にバックアップを取って7日間保持するといったことができるので、バックアップの自動化や効率的なストレージの利用に役立ちます。
Amazon EBSを例に、AWS Backupでバックアップする手順は以下のとおりです。

  1. AWS Backupでバックアッププランを作成

  2. バックアップルールで、スケジュールやライフサイクル、Backup vaultを設定(1日1回のバックアップ、保持期限は7日など)

  3. 作成したバックアッププランに、リソース(Amazon EBS)を割り当て

これで、指定した日時にAmazon EBSスナップショットが作成されてAmazon S3に保存されます。また、AWS Backupでは、作成したバックアップはBackup vaultに復旧ポイントという単位で保存されます。

図1:AWS BackupでAmazon EBSをバックアップする

図1:AWS BackupでAmazon EBSをバックアップする

ここで、Amazon EBSスナップショットは増分バックアップのため、スナップショット作成にかかる時間とコストを抑えることができます。増分バックアップの概要は以下のとおりです。

  1. ボリュームに10GBのデータがある(状態1)。最初のスナップショットAでは、10GBのデータ全体をコピー。

  2. 10GBのうち4GBが変更(状態2)。スナップショットBでは、変更された4GBのみ保存。残り6GBはスナップショットAを参照。

  3. 2GBがボリュームに追加(状態3)。スナップショットCでは、追加の2GBのみ保存。残り6GBと4GBは、スナップショットAとスナップショットBを参照。

3つのスナップショットに必要なストレージの合計は、16GBです。

図2:Amazon EBSスナップショットのしくみ

図2:Amazon EBSスナップショットのしくみ

Amazon EBSのリストア手順の概要は以下のとおりです。

  1. リストアするスナップショットを検討・判断

  2. AWS Backupで復元するリソースを選択してバックアップを復元

  3. ボリュームを置き換えるAmazon EC2インスタンスを選択

  4. Amazon EC2インスタンスに接続されているボリュームをアンマウントしてデタッチ

  5. 2.で復元したボリュームをAmazon EC2インスタンスにアタッチしてマウント

リストアは予め手順を策定しておかなければ、いざというときに復旧に時間がかかってしまいます。また、バックアップを保存するためにストレージをどれだけ使ったかによってコストが変わってくるため、注意が必要です。

1.2 HAクラスタソフトウェア

RTOとRPOをどちらも最小化したい場合、おすすめするのがHAクラスタソフトウェアです。HAクラスタソフトウェアのポイントは2つあります。

Point1:トータルな監視により、復旧時間を最小化

HAクラスタソフトウェアは、物理サーバーなどのインフラ基盤に加えて、ディスク、ゲストOS、ミドルウェアやアプリケーション、さらにAvailability Zone(アベイラビリティーゾーン)までトータルに監視しています。このため、Availability Zoneが丸ごとダウンしても異常を即座に検出、予備のAmazon EC2インスタンスにアプリケーションを引き継ぐことで復旧時間を最小化できるのです。実際に、空調設備のオーバーヒートや冷却システムの電力喪失などが原因でAvailability Zoneがダウンし、ショッピングサイトやキャッシュレスサービスサイトが停止したことがあります。HAクラスタソフトウェアなら、Availability Zoneがダウンしてもサービスを自動で継続できます。

図3:HAクラスタソフトウェアによるトータルな監視

図3:HAクラスタソフトウェアによるトータルな監視

Point2:最新データをネットワーク経由で複製することでデータ喪失量を最小化

予備のAmazon EC2インスタンスで業務を再開するためには、トラブル直前のデータをもとにアプリケーションを動作させる必要があります。そこで、HAクラスタソフトウェアでは、通常運転時にアプリケーションが書き込んだデータをネットワーク経由で予備のAmazon EC2インスタンスのディスクに複製するしくみを備えています。このしくみにより、予備のAmazon EC2インスタンスは最新データをもとに業務を再開できる、つまりデータ喪失量を最小化できるのです。

図4:HAクラスタソフトウェアによるデータ共有

図4:HAクラスタソフトウェアによるデータ共有

HAクラスタソフトウェアを使うためには、別途、ライセンス費用が必要ですが、上で解説したようなトータルな監視や最新データを複製するしくみを利用者側で考える必要はなく、HAクラスタソフトウェアに任せることができます。また、AWSが提唱している、複数のAvailability Zoneでアプリケーションを稼働させるというベストプラクティスにも則ることができます。
さらに、前編でご紹介したAmazon CloudWatchの復旧アクションの1つであるAmazon EC2 Auto Scalingでは、オートスケールに対応していないアプリケーションは復旧できません。そして、Auto Recoveryでは、Availability Zone障害時は自動で復旧できません。HAクラスタソフトウェアなら、この2つの課題が解決できるのです。

2. まとめ

前編と後編にわたって、AWSにおける4つの障害対策を解説しました。RTOを短くするための手法としてAmazon Cloud Watch(監視サービス)とAuto Recovery(HA機能)、RPOを短くするための手法としてAWS Backup(バックアップ)があります。そして、RTOとRPOをどちらも短くするための手法として、HAクラスタソフトウェアがあります。業種や業務のシステム特性によって、RTOやRPOは異なります。それぞれの手法には特徴があり、どれを使うかはコストとのバランスもあります。この中からどれか1つを選べばよいわけではなく、バックアップとHAクラスタソフトウェア、バックアップと監視サービス、監視サービスとHA機能、といったように、システム特性によって併用することがポイントです。

図5:ユースケースに応じた障害対策

図5:ユースケースに応じた障害対策

こちらもおすすめ

オンプレミスからクラウドへ移行で障害対策に疑問や不安を抱えていませんか?HAクラスタリング・ソフトウェア「PRIMECLUSTER」が解決します。

  • 備考
    Amazon Web Services、AWS、Amazon EC2、Amazon EBS、Amazon CloudWatch、AWS Management Console、Amazon SNS、Amazon EC2 Auto Scalingは、Amazon.com, Inc. またはその関連会社の商標です。

本コンテンツに関するお問い合わせ

お電話でのお問い合わせ

富士通コンタクトライン(総合窓口)

0120-933-200

受付時間:9時~12時および13時~17時30分
(土曜日・日曜日・祝日・当社指定の休業日を除く)

Webでのお問い合わせ

当社はセキュリティ保護の観点からSSL技術を使用しております。

ページの先頭へ