ペタスケールコンピューティングの実現には、システムとして多数の計算ノードを高速に接続することに加え、アプリケーションも超並列対応が必要になります。PRIMEHPC FX10は、大規模構成が可能な高速インターコネクトとアプリケーションの超並列対応に有効なハイブリッド並列化を支援する機能を備えています。
PRIMEHPC FX10は、6次元メッシュ/トーラスアーキテクチャーのTofuインターコネクトにより、98,304ノードからなる大規模構成が可能であり、システムとして最大23.2PFLOPSを実現します。Tofuインターコネクトのアプリケーションビューは、シンプルな3次元トーラスになります。
各ノードは10ポートのTofuリンクを備え、隣接する10ノードと直接接続されます。Tofuリンクはノード間の直接接続により低レイテンシーを実現するとともに、リンクあたり5GB/s(×双方向)という高い通信バンド幅を達成しています。
さらに、Tofuインターコネクトはノード間バリアやリダクション演算をハードウェアでアシストする機構を備えており、集団通信も高速に処理することができます。
*1 Tofu: Torus Fusion
Tofuインターコネクトの
トポロジ(概念図)
MPI並列にスレッド並列を組み合わせたハイブリッド並列は、アプリケーションの超並列対応を実現する有効な並列化手法です。PRIMEHPC FX10では、SPARC64TM IXfxのコア間ハードウェアバリア機構と12MBの大容量共有L2キャッシュ、コンパイラの高度な自動並列化機能を組み合わせたVISIMPACTにより、自動スレッド並列化とその高効率な実行が実現できます。これにより、従来のMPIで並列化されたプログラムのハイブリッド並列への移行が容易に行えます。
*2 VISIMPACT: Virtual Single Processor by Integrated Multicore Parallel Architecture
VISIMPACTのイメージ