Solaris Fault ManagerはOSによるハードウェアエラーの検出・解析、故障箇所の切り離しを行う機能です。
Solaris Fault Managerを利用することにより、障害の発生から診断復旧までの時間が削減され、システムの可用性を向上します。
Solaris 10ではError Handlerと呼ばれるコンポーネント監視機能により、エラーを検出します。エラー情報を受け取ったFault Managerは、診断を行うDiagnosis Engineでこのエラー情報を診断します。Fault Managerはエラーのログを記録するとともに、Agentに障害のあるコンポーネントをオフライン化するよう指示し、エラーメッセージを出力させます。
システム管理者はこのエラーメッセージを確認し、故障コンポーネントの交換などの対応を行います。また、メッセージに記録されたURLをもとに富士通およびSun Microsystems社 が提供するWebサイトを参照し、エラーに関する詳細な情報を得ることができます。
Solaris 9までは、あるコンポーネントで故障の兆候が見られると、そのコンポーネント名とエラー情報をメッセージとしてsyslogに記録していました。システム管理者はこのメッセージを確認して対処方法を判断する必要がありました。
Solaris 10では、出力されるエラーメッセージが変更されました。エラーメッセージにはメッセージID、WebのURL、対処方法などについて記載されています。システム管理者はこのエラーメッセージに従って対応することができます。
また、出力されるメッセージに記載されているURLから富士通またはSun Microsystems社が提供しているWebサイトの情報(Knowledge Article Web)を参照することができます。システム管理者はWeb上の情報を参考にエラーの詳細や対処方法などについて把握することができます。
予測的セルフヒーリング目次