クラウドでも起こりうる大規模障害、「止まる」を前提に障害対策をしていますか?

私たちの暮らしを大きく変容させるデジタルトランスフォーメーション(DX)が加速し、既存システムからクラウドへの移行もますます進んでいます。しかし、クラウドではインフラ基盤は冗長化されているものの、すべての障害を防ぐことができません。オンプレミスからクラウドへ移行する場合、これまでの安定稼働を維持しつつ、クラウドの良さを生かせないものでしょうか。ミッションクリティカルな基幹システムをクラウドで利用する場合、最適な障害対策のソリューションはあるのでしょうか。

オンプレミスからクラウドへの移行でこんな疑問不安を抱えていませんか?

クラウドサービスが提供するHA機能で障害対策は万全?クラウドでHAクラスタリングソフトウェアを動かすためのポイントとは?(データの引継ぎ / ネットワークの引継ぎ / 両系オンラインの防止) データの引継ぎ ネットワークの引継ぎ 両系オンラインの防止

クラウドサービスが提供するHA機能で障害対策は万全?

止めないためのシステム構築の極意

クラウドでは物理サーバーで故障が発生したときに、自動的にフェイルオーバーを実施するHA機能が提供されています。この機能は事前設定なしに使えるものもありますが、監視できるのはインフラ基盤に限定されています。つまり、上位階層にあるゲストOSや業務アプリケーションまでは監視できず、障害発生時には同一のアベイラビリティゾーンの別のサーバーでインスタンスが再起動して復旧します。そのため、大規模障害発生時にはアベイラビリティゾーンの障害により、業務が停止します。
この課題を解決できる1つの方法が、HAクラスタリングソフトウェアを使い、複数のアベイラビリティゾーンでアプリケーションを稼働させるものです。これであれば、すべての階層を監視できるだけでなく、障害時には待機系サーバーに即時切替ができ、業務停止時間を最小限に抑えることができます。

動画での説明はこちら

止めないためのシステム構築の極意

HAクラスタリングソフトウェア導入のメリット

  • インフラ基盤の上位の階層まですべてリアルタイムで異常を検知できる
  • ジョブ管理ソフトウェアのバッチ業務の進捗情報も引継ぎ、人手を介さずにジョブの継続実行ができ、安心して運用できる
  • オンプレミスのクラスタ構成をそのままクラウドへ移行可能。そのため、リソースやスクリプトなどをそのまま利用できるため、運用変更も不要

例えば……こんなトラブルを防止できます!

  • IaaS故障で売掛金を処理する夜間バッチが異常終了、業務支援ポータルサイトが停止し、出荷業務が遅延
  • 販売管理システムにアクセスできず、注文受付や入出金、照会画面表示などが正常に稼働しない状況が発生。処理漏れや遅延により、金銭的な損失が出る

クラウドでHAクラスタリングソフトウェアを動かすためのポイントとは?

オンプレミスとの違いを知る

クラウドとオンプレミスでは、基本的に考え方が違います。そのため、HAクラスタリングソフトウェアがクラウドできちんと動くのかと疑問に思われる方も多いでしょう。そこでここからはデータやネットワークはどう引継ぎされるのか、両系オンラインはどう防止するのか、オンプレミスとの違いを紹介します。

データの引継ぎ

共用ディスクが使えない環境でのデータの引継ぎは?

オンプレミスではクラスタを組む場合、運用系と待機系のデータを円滑に引き継ぐために共用ディスクを使用するシステム構成が一般的でした。しかしクラウドの場合、アベイラビリティゾーンが異なると、共有ディスクを利用できません。Fujitsu Software PRIMECLUSTERではネットワーク経由でローカルディスクを複製(サーバー間ミラーリング)することで、データ同期を保証しています。

データの引継ぎ

ネットワークの引継ぎ

用途に応じて柔軟な使い方をしたいが、ネットワークの引継ぎはどうなるのか?

クラウドのネットワーク設計では考慮すべきポイントがあります。クラスタ構成にアクセスするクライアントを同じクラウド内に配置するのか、もしくはオンプレミスに配置するのかという点です。またアベイラビリティゾーン間は、サブネットが異なるのでルーティング制御も必要です。さらに業務には仮想IPアドレスでアクセスするのか、もしくは仮想ホスト名でアクセスするのか、どうアクセスするのかでクラスタ側で引き継ぐネットワーク構成も異なります。このようなお客様のさまざまな要望に応じて、PRIMECLUSTERでは柔軟に構成パターンを選択いただけるようにしています。

ネットワークの引継ぎ

両系オンラインの防止

両系オンラインを防ぐためにはどうすればよい?

クラスタ構成の場合、運用系から待機系に切り替える際のデータ不整合やファイルシステムの破壊などを防止するための対策が必要です。オンプレミスでは、物理サーバーと連携することで、障害が発生した場合、異常ノードを停止し、データの不整合などを防止していました。しかしクラウドでは、物理的なハードウェアが見えないため、物理サーバーと連携できません。PRIMECLUSTERでは運用中のアベイラビリティゾーンで一時的に障害が発生した際、業務が二重に起動して不具合を起こすことを避けるために異常が発生したアベイラビリティゾーン上の業務停止から待機系での起動までを自動で行います。これにより、大切なデータを破壊することなく、システムの安定稼働を実現できるのです。

両系オンラインの防止

導入の効果

「PRIMECLUSTER」を導入すれば、次のような効果が期待できます。

  • インフラ基盤からアプリケーションまでをトータルに監視、オンプレミスと同等の安定稼働をクラウドサービスでも実現でき、ビジネスチャンスを逃しません
  • アベイラビリティゾーンに障害が発生しても、待機系でジョブ管理ソフトウェアのバッチ業務を自動で再開、安心してお客様と取り引きができます
  • 一時的な障害が発生しても大切なデータを保護、金銭的損失や社会的信頼を失墜することなく、お客様の未来を守ります

社会インフラを支えるさまざまなシーンで役立ちます

動画でもっと詳しく

カタログ・ご紹介資料で詳しく知る

本コンテンツに関するお問い合わせ

お電話でのお問い合わせ

富士通コンタクトライン(総合窓口)

0120-933-200

受付時間:9時~12時および13時~17時30分
(土曜日・日曜日・祝日・当社指定の休業日を除く)

Webでのお問い合わせ

当社はセキュリティ保護の観点からSSL技術を使用しております。

ページの先頭へ