Skip to main content

Fujitsu

Japan

メモリミラー、メモリパトロールによるメモリの信頼性向上


関連製品:SPARC M10-1, M10-4, M10-4S
SPARC M12-1, M12-2, M12-2S


ECC、拡張ECCによるデータ保護

メモリは、ECCおよび拡張ECCにより、データが保護されています。

ECC(Error Checking and Correction)

ECCは、データにECCコードを付加することで、1bitエラーから確実にデータを保護する機能です。

拡張ECC(注1)

DIMMに搭載されたメモリ素子(DRAM)で故障が発生した際に、ECCの仕組みを応用してデータを救済する機能です。

注1:IBM社のChipkill機能に相当します。

メモリの二重化を実現するメモリミラー

SPARC M12およびSPARC M10は、メモリの二重化によりデータを保護するメモリミラーに対応しています。メモリミラーにより、メモリにおけるマルチビットエラーのようなECCでは訂正不可能なエラーからデータを保護します。そのため、単一システムとしての信頼性を向上できます。
メモリアクセスコントローラはプロセッサに内蔵されており、プロセッサ単位でメモリミラーを設定できます。

メモリミラーを設定した場合

メモリにデータを書き込む際は、メモリAとメモリBに同時に書き込みます。

メモリからデータを読み出す際は、ECCによりデータエラーが発生してないか確認します。もしメモリAで訂正不可能なエラーが検出された場合、メモリBのデータを使用して業務を継続することが可能です。

エラーを事前に検出するメモリパトロール

メモリパトロール注2は、メモリでエラーが発生していないか事前に検査を行う機能です。メモリパトロールにより、 OS やアプリケーションがメモリを使用する前にエラー発生を検出し、エラー訂正や縮退を行うことができます。

SPARC M12およびSPARC M10の場合、メモリアクセスコントローラーがメモリパトロールを行います。OSやCPUリソースを使わずにメモリパトロールを実行できるので、業務に影響をおよぼすことなく、高速にメモリのエラーチェックを行えます。

注2:「メモリスクラバ」と呼ぶ場合があります。