国立研究開発法人 産業技術総合研究所 様
4,352基のGPUを搭載、世界トップクラスの性能と省電力を実現
「AI橋渡しクラウド(ABCI)」でAIの社会実装を加速
「技術を社会へ」をスローガンに、日本の社会や産業の発展に貢献する国立研究開発法人 産業技術総合研究所(以下、産総研)。2018年8月、AIの社会実装を推進するべく、一般企業が利用できる大規模AIクラウド計算システム「AI橋渡しクラウド(AI Bridging Cloud Infrastructure、以下ABCI」のサービスを開始しました。ABCIは4,352基のGPUを搭載し、世界トップクラスの性能と省電力を実現。また汎用的なハードウェアの採用により、安価なサービス料金を実現し、同時にユーザーの使っているソフトウェアをそのまま利用可能にしました。富士通の大規模システム構築・運用のノウハウと、富士通研究所のAIに関する知見を駆使し、ABCI構築、運用・保守のサポートにより、企業の挑戦を支えています。
導入事例概要
業種 | 公的研究機関 |
---|---|
主要製品 | FUJITSU Server PRIMERGY CX2570 M4 |
- 課題一般企業が利用しやすい環境と世界トップクラスの性能を実現したい
- 効果汎用的なハードウェアを大規模に搭載、ユーザーが社内で使っているソフトウェアをそのまま利用可能。安価で世界トップクラスの性能を活用できる
- 課題大規模AIクラウド計算システムを高品質・短期間で構築したい
- 効果HPCシステムの豊富な導入実績とノウハウ、富士通研究所のAIに関する専門的知見を駆使し、高品質・短納期を実現
- 課題AIに関する最先端の研究を行える環境の提供により、技術的挑戦を促進したい
- 効果富士通研究所がABCIを利用し画像データを使った学習時間で世界最高速を達成※するなど、様々なベンチマークで世界トップクラスにランクイン
※2019年3月26日現在、当社調べ
「産総研には、大学の計算機センターのようにスパコンの運用を専門に担う組織がありません。これまでも2017年4月から稼働を開始した産総研AIクラウド(AAIC)をはじめとして中規模のHPCシステムを研究者主体で運用してきましたが、内部利用や共同研究利用に留まっていました。ABCIのような大規模なHPCシステムを産学官にまたがる数千規模のユーザーにサービス提供するというのは、我々にとって未知の領域であったというのが実情でした。今回、HPCシステムの導入経験が豊富な富士通だったからこそ、短期間の構築スケジュールにも関わらず予定通りにABCIのサービスをリリースできました」
国立研究開発法人 産業技術総合研究所
人工知能研究センター(AIRC)
人工知能クラウド研究チーム
研究チーム長
小川宏高 氏
背景
AIによる新たな価値の社会還元を目指す「AI橋渡しクラウド」
2001年に発足以来、「技術を社会へ」をスローガンに産業技術の幅広い分野で研究活動を続ける国立研究開発法人 産業技術総合研究所(以下、産総研)。日本最大級の公的研究機関として日本の産業や社会に役立つ技術の創出とその実用化や、革新的な技術シーズを事業化に繫ぐための「橋渡し」機能に注力しています。また日本がイノベーションを創出し続けるために必要なナショナルシステムの構築に中核的な役割を担っています。
産総研では持続可能な社会の構築に向け、「豊かで環境に優しい社会を実現するグリーン・テクノロジー」、「健康で安心・安全な生活を実現するライフ・テクノロジー」、「超スマート社会を実現するインフォメーション・テクノロジー」の3本柱で研究開発を進めています。「インフォメーション・テクノロジー」における重点テーマの1つが、「ビッグデータから価値を創造するAI(人工知能)技術」です。日本のAI推進における課題について、産総研 人工知能研究センター 人工知能クラウド研究チーム 研究チーム長 小川宏高氏はこう話します。
「2018年、情報処理推進機構が公表したAI社会実装推進調査報告書のアンケート結果によると、実証実験(PoC)を含めてAIをすでに導入している企業が約1割、その一方でAIに取り組みたいと考えている企業が8割に及んでいます。問題は、この8割の企業に対する受け皿がないことです。国内のデータセンターをはじめとする事業者の多くはどれだけのユーザーが利用するのか、未知数であることから大きな投資を控えているのが現状です」と話し、こう続けます。
「経済産業省が推進する『人工知能に関するグローバル研究拠点整備事業』の一環として、産総研がAIに取り組みたい企業のチャレンジを後押しするために構築したのが、世界最大級規模のAI向けクラウド型計算システム『AI橋渡しクラウド(AI Bridging Cloud Infrastructure、以下ABCI)』※です」
- ※ABCI: https://abci.ai/
ポイント
実践的な視点を大切にした調達
ABCIは研究機関だけでなく、一般企業を利用対象とするため、いつでもどこにいても多くの人にとって使いやすいシステムであることを非常に重視しています。使いやすさで重要なポイントとなるのが、コストと利用環境です。「ABCIでは、汎用的で、商用オフザシェルフ(COTS)のハードウェアやソフトウェアを採用することで、比較的安価なサービス料金で、ユーザーが社内で使っているソフトウェアをそのまま利用することが可能です」と小川氏は話します。世界最高水準のAI研究を行うために、いかにコストを抑えながら高い性能を実現するか。今回、ABCIの調達では、公表した予定価格の中でより良い提案に対し評価ポイントが高くなる仕様書を作成したと小川氏は話します。
「機械学習は、収束するまで反復計算を行うことに加え、試行錯誤を繰り返して機械学習の予測精度を高めていく必要があることから、計算能力が鍵となります。仕様書では、基本的に最低ラインのスペックを提示しました。一方ベンチマークは、ビッグデータ処理や機械学習などABCIに期待されるユースケースを調査して新規に開発しました。これは、ABCIが実際に利用する条件のもとで技術力の高いベンダーを選別するという意図があってのことです。仮に同スペック、同規模のシステムを提案するベンダーがあった場合には、ベンチマークでより高いスコアを出したベンダーを選ぶという、実践的な視点を大切にした調達を行うことができました」
産総研によるABCIの仕様書に基づく総合評価方式のもと、一般競争入札において富士通が受注しました。
システムの概要
4,352基のGPUを搭載、世界トップクラスの性能と省電力を実現
2017年9月に富士通の受注決定、2018年1月にデータセンター竣工、同年6月にシステムが完成し、同年7月に試験運用を開始、同年8月に運用をスタートしました。
ABCIでは、高集積・省電力設計と高性能アーキテクチャーを兼ね備えた富士通の高密度マルチノードサーバ「PRIMERGY CX2570 M4」を採用。Intelの「インテル® Xeon® Goldプロセッサー」をサーバ1台あたり2基(合計2,176CPU)搭載、NVIDIA® のGPUコンピューティングカード「Tesla® V100」をサーバ1台あたり4基(合計4,352基)備えることにより、理論ピーク性能でAIやビッグデータ分野の計算処理で有効とされる16bitの半精度演算性能550PFLOPS、従来のコンピュータシミュレーションなどで重要な倍精度演算性能37PFLOPSを実現しました。また高温になる演算処理装置などに対し、AIデータセンター棟が供給する外気に近い温度の冷却水で直接冷却するなどにより、世界トップクラスの省エネ性能を達成。さらに1ラックに17シャーシ、34ノードを収納することで、省スペースとともに冷却効果を高めています。
利用しやすいソフトウェア環境もABCIの大きな特徴です。「ユーザーの既存ソフトウェア環境を考慮し、様々な分野、複数のバージョンを揃えて、ユーザーが自由に選択して利用できるようになっています。またコンテナをサポートしており、ユーザーのソフトウェア環境の展開も容易です」
ABCI構築当時、Tesla® V100は国内初導入であり、なおかつ4,352基の導入だったことから、富士通は事業部、サポート部門、営業・SE・CE、富士通研究所と特別対応体制を敷いて取り組みました。富士通のサポートについて小川氏は「産総研には、大学の計算機センターのようにスパコンの運用を専門に担う組織がありません。これまでも2017年4月から稼働を開始した産総研AIクラウド(AAIC)をはじめとして中規模のHPCシステムを研究者主体で運用してきましたが、内部利用や共同研究利用に留まっていました。ABCIのような大規模なHPCシステムを産学官にまたがる数千規模のユーザーにサービス提供するというのは、我々にとって未知の領域であったというのが実情でした。今回、HPCシステムの導入経験が豊富な富士通だったからこそ、短期間の構築スケジュールにも関わらず予定通りにABCIのサービスをリリースできました」と評価します。
効果と将来の展望
様々なベンチマークで世界トップクラスの高速性と省電力性を実証
ABCIの設計・開発、運用は、人工知能研究センターと産総研・東工大 実社会ビッグデータ活用オープンイノベーションラボラトリ(RWBC-OIL)が共同で行っています。富士通は構築に加え、運用支援と保守サポートでABCIの安定稼働を支えています。
ABCIを利用したベンチマークの実績として、世界のスパコン速度性能ランキングTOP500世界第5位(2018年6月)、スパコン電力性能ランキングGreen500世界第3位(2019年6月)、TOP500に加え新たな性能指標となるベンチマークHPCG(High Performance Conjugate Gradient)世界第5位(2018年11月)など世界トップクラスの高速性と省電力性を実証。また富士通研究所はABCIを利用し、画像認識のディープニューラルネットワークであるResNet-50(注1)において、画像認識精度を競うコンテストILSVRC2012(注2)での画像データを使った学習時間で世界最高速を達成(2019年3月26日現在、当社調べ)しました。AIの最重要課題への挑戦をテーマに掲げるABCIでは、画期的な成果が見込まれる研究課題に対し、ABCIの全計算ノードを最大24時間、1研究グループで占有利用ができる公募型チャレンジプログラムを実施しています。
ABCIは、インターネットを介して一般企業が利用できることから、運用面ではクラウドサービス水準のセキュリティの実現が重要なポイントになったと小川氏は話します。「産総研では、ABCIのセキュリティ管理体制、セキュリティ実装、利用者と産総研の責任分界点などをまとめたセキュリティホワイトペーパーを整備、公開しています。ABCIが自社のセキュリティ要件を満たしているか、利用にあたってどのようなことに気をつけなければならないかなど、企業がABCIを利用する上での判断基準としてご活用いただいています。もちろん、富士通の運用支援においてもホワイトペーパーを遵守した運用をお願いしています」 現在、ABCIを利用したプロジェクト数は約100、ユーザー数は1,000名規模です。製造業、電機メーカー、IT企業、AIに関するスタートアップ企業、医療、大学など、幅広い分野のユーザーが利用しています。今後の展望について小川氏はこう話します。
「産総研は、技術開発のための道具としてだけではなく、AIやビッグデータなどの技術を産業や人々の社会生活の隅々まで浸透させ、イノベーションを創出し、社会課題を解決するSociety5.0を実現していく、その第一歩としてABCIを位置づけています。次のステップとして、AIの社会実装における“あるべき姿”をデザインした上で、エッジ側(デバイス)とクラウド側(ABCI)を垂直統合していくことが必要だと考えています。富士通には運用支援業務を通じて、ユーザーのニーズ拡大や高度化に貢献いただきたいと考えています」
富士通は、これからも「AI橋渡しクラウド」に対する技術支援を通じて社会や産業の持続的発展に貢献していきます。
担当営業・担当SEメッセージ
AI研究開発・実証を推進する世界最大級のAIインフラであるABCIのプロジェクトは、富士通にとっても初めての経験で、富士通の総合力を活かし、高いモチベーションで取り組ませていただきました。お客様と共に、次の時代を創る先駆者として、新たな価値創出に貢献していきます。
富士通 TCソリューション事業本部 計算科学ソリューション統括部 シニアマネージャー 坂口 吉生
前例のない超大規模なAIインフラの導入は非常に大きなチャレンジでしたが、歴史的なプロジェクトに携わる喜びを感じながら取り組んできました。引き続きABCIの安定したサービス提供に寄与するとともに、AI技術を活用した新しい社会をお客様と共創していきたいと考えています。
富士通 TCソリューション事業本部 TC統括営業部 第一営業部 岸 雅人
国立研究開発法人産業技術総合研究所 様
創立 | 2001年(平成13年)4月1日 |
---|---|
理事長 | 中鉢 良治(ちゅうばち りょうじ) |
所在地 | 東京本部 〒100-8921 東京都千代田区霞が関一丁目3番1号
つくば本部 〒305-8560 茨城県つくば市梅園1-1-1 中央第1 つくば本部・情報技術共同研究棟 |
職員数 | 3,030名(研究職員2,331名、事務職員699名) ※2018年7月1日現在 |
主な事業内容 | 産業技術に関わる研究 |
ホームページ | https://www.aist.go.jp/ |
用語解説
- 注1:ResNet-50 マイクロソフト社の開発した高性能な画像認識ディープニューラルネットワーク。
- 注2:ILSVRC2012 「ImageNet Large Scale Visual Recognition Challenge 2012」。
[2019年9月掲載]
本事例中に記載の肩書きや数値、固有名詞等は取材日時点のものであり、このページの閲覧時には変更されている可能性があることをご了承ください。
官公庁向けソリューションに関するお問い合わせ・ご相談
当社はセキュリティ保護の観点からSSL技術を使用しております。