Skip to main content

Fujitsu

Japan

予測的セルフヒーリング:Oracle Solaris 10 新機能
機能編(2):Solaris Fault Manager

概要

Solaris Fault ManagerはOSによるハードウェアエラーの検出・解析、故障箇所の切り離しを行う機能です。
Solaris Fault Managerを利用することにより、障害の発生から診断復旧までの時間が削減され、システムの可用性を向上します。

ハードウェアエラー診断機構

Solaris 10ではError Handlerと呼ばれるコンポーネント監視機能により、エラーを検出します。エラー情報を受け取ったFault Managerは、診断を行うDiagnosis Engineでこのエラー情報を診断します。Fault Managerはエラーのログを記録するとともに、Agentに障害のあるコンポーネントをオフライン化するよう指示し、エラーメッセージを出力させます。

システム管理者はこのエラーメッセージを確認し、故障コンポーネントの交換などの対応を行います。また、メッセージに記録されたURLをもとに富士通およびSun Microsystems社 が提供するWebサイトを参照し、エラーに関する詳細な情報を得ることができます。

エラーメッセージの変更とKnowledge Article Web

Solaris 9までは、あるコンポーネントで故障の兆候が見られると、そのコンポーネント名とエラー情報をメッセージとしてsyslogに記録していました。システム管理者はこのメッセージを確認して対処方法を判断する必要がありました。

Solaris 10では、出力されるエラーメッセージが変更されました。エラーメッセージにはメッセージID、WebのURL、対処方法などについて記載されています。システム管理者はこのエラーメッセージに従って対応することができます。

また、出力されるメッセージに記載されているURLから富士通またはSun Microsystems社が提供しているWebサイトの情報(Knowledge Article Web)を参照することができます。システム管理者はWeb上の情報を参考にエラーの詳細や対処方法などについて把握することができます。

予測的セルフヒーリング目次

  • 概要
  • 機能編
    Solaris Service Manager
    サーバ上で稼動するサービスを一元管理する機能を紹介
    Solaris Fault Manager
    OSによるシステム情報の自動収集、診断機能を紹介