安全な生成AIアプリケーションを簡単に開発する秘訣とは? ~データベース選びで失敗しないために~ - db tech showcase 2025参加レポート
PostgreSQLインサイド


吉田 昂太郎
富士通株式会社
ソフトウェアオープンイノベーション事業本部 データマネジメント事業部
専門分野
- データベース
2024年からPostgreSQLをベースにしたデータベース「Fujitsu Enterprise Postgres」の開発業務に従事
はじめに
2025年7月10日、11日に開催されたdb tech showcase 2025に参加しました。
db tech showcaseは、データに関わるすべての技術者に「学び」「気づき」「変化」を提供する、国内最大規模のデータとデータベース関連のカンファレンスです。2011年の開催以来、国内外のデータベースの革新的な技術や最新事例が紹介され、今回が14回目となりました。
今回私は、PostgreSQLを用いたRAG開発について講演しました。この記事ではその内容を中心に紹介します。
講演内容
PostgreSQLの持つ拡張性と活発なコミュニティによる技術の成長の観点からPostgreSQLは技術の進歩が著しい生成AI分野において最適なデータベースであるといえます。私は講演でPostgreSQLを用いることでRAGアプリケーションを簡単に開発する方法に関して解説しました。
講演の様子
この記事では講演内容を基に以下の流れで説明します。
RAGの概要
RAGは、大規模言語モデル(LLM)で企業が保有するデータを活用して回答精度を飛躍的に向上させるための仕組みです。従来のLLMは、学習データに基づいた一般的な知識しか持ち合わせていませんでした。しかし、RAGを導入することで、ユーザーからの質問に対し、まず社内データベース(例:戦略計画書や市場調査レポートなど)から関連性の高い情報を検索・取得します。次に、この取得した情報とユーザーの質問をLLMに渡し、回答を生成させます。このプロセスにより、LLMは特定の業務分野や専門知識、あるいは最新の社内情報に基づいた、より具体的で精度の高い回答を提供できるようになります。RAGアプリケーションにおいて、社内データを効率的かつ安全に活用するためには、基盤となるデータベースの適切な運用が極めて重要なポイントになります。
図1:RAGの概要(講演資料より)
RAGアプリケーション開発のポイント
RAGアプリケーション開発のポイントを3つ挙げました。
図2:RAGシステムの全体像(講演資料より)
ポイント1:検索の性能
データベースの検索性能は、「速度」と「精度」の2つの側面から重要です。
検索速度:検索性能が向上することで、ユーザーは質問から回答取得までの待ち時間を短縮できます。これはユーザーエクスペリエンス(UX)の向上に直結し、RAGシステムの利便性を高めます。
検索精度:データベースの検索精度を高めることは、LLMが生成する回答の精度向上に繋がります。関連性の高い正確な情報がLLMに渡されることで、ユーザーは自身の質問意図に合致した、より適切で信頼性の高い回答を得ることが可能になります。
ベクトルデータベース
ベクトルデータベースは、テキストの情報などを数値のベクトル(Embedding)として保存し、そのベクトル間の類似度に基づいて検索するデータベースです。ユーザーの質問文も同様にベクトル化され、データベース内のベクトルと照合することで、意味的に最も関連性の高い情報を効率的に取得します。これにより、従来のキーワード検索では見落とされがちな、意味的な関連性に基づいた柔軟な情報検索を実現します。
図3:回答精度を高くするベクトルデータベース(講演資料より)
グラフデータベース
グラフデータベースは、データとその間の関係性を「ノード(頂点)」と「エッジ(辺)」で表現するグラフ構造で管理します。この特性により、データ間の複雑な関係性をグラフで表現することで、より深い文脈理解に基づいた検索を実現します。これにより、情報を断片的ではなく関連性の中から必要な情報を抽出し、論理的な回答を生成することが可能になります。
図4:回答精度を高くするグラフデータベース(講演資料より)
インデックスの最適化
RAGにおいて、どれほど検索精度を高くても、検索速度が遅ければ実用性は損なわれます。検索速度を向上させる技術としてStreaming Disk ANNのようなインデックス作成技術が有効です。これにより、大規模なデータセットに対しても、高速かつ高精度な検索を実現し、ユーザーがストレスなくRAGシステムを利用できる環境を提供します。インデックスは、データベースの検索性能を決定づける重要な要素の一つです。
図5:高速にデータベースを検索(講演資料より)
ポイント2:情報の鮮度
RAGシステムでは、参照するデータのリアルタイム性が極めて重要です。例えば、最新の契約情報や交渉記録といったデータを検索する際、データベース内の情報が常に最新の状態に保たれていれば、ユーザーは常に最新かつ正確な情報を回答として取得できます。データの鮮度が保証されることで、LLMは陳腐化した情報に基づいて回答を生成するリスクを回避し、ビジネスにおける意思決定の質を高めることができます。
データベースの定期的な更新
RAGアプリケーションがデータベースを検索する際、情報の鮮度が保たれていることが求められます。これにより、常にリアルタイムな情報検索が可能となります。例えば、PostgreSQLの内部でベクトル変換を行うことで、従来必要だった外部システムでのデータ管理や監視の必要がなくなり、データ更新からベクトル化、そして検索可能になるまでのタイムラグを大幅に短縮できます。これにより、データの鮮度を効率的に維持し、RAGシステムが常に最新の情報を提供できる環境を構築できます。
図6:データの定期的な更新(講演資料より)
ポイント3:情報漏洩対策
RAGアプリケーションは、社内データベースから機密性の高い情報を検索し、RAGアプリケーションを通じてLLMに渡す特性を持つため、データ漏洩のリスクが常に存在します。このリスクを最小限に抑えるためには、データベースレベルでの強固な情報漏洩対策が不可欠です。適切なセキュリティ対策を講じることで、ユーザーは情報の機密性に関する懸念なく、RAGシステムを安心して利用できるようになります。
オンプレミスでの運用
従来、外部のモデルを利用して行っていたEmbedding処理をPostgreSQLの内部にインポートすることで、RAGアプリケーションのオンプレミス運用が可能になります。これにより、社内の機密情報や個人情報を含むデータもRAGアプリケーションで安全に利用できるようになります。
図7:高セキュリティなデータベース(講演資料より)
Fujitsu Enterprise Postgresを用いてRAG開発
ハイブリッド検索
富士通のデータベース「Fujitsu Enterprise Postgres」(以降Enterprise Postgres)は、より精度の高い検索機能としてハイブリッド検索機能を提供します。ハイブリッド検索は、キーワード検索の正確性とベクトル検索の網羅性を組み合わせることで、正確かつ網羅的にデータ検索を実現します。従来のOSSでは、追加のアプリケーション開発や検索性能維持のためのチューニングが必要でしたが、Enterprise Postgresを利用することで、アプリケーション開発と運用時のチューニング管理を容易に実現することができます。
図8:ハイブリッド検索(講演資料より)
高速処理
Enterprise Postgresは、並列検索、インメモリ機能、高速ローダーを活用し、データベース性能を向上させます。並列検索は、クエリ実行時に最適なワーカー数を動的に割り当て、効率的なデータ処理を実現します。インメモリ機能は、集計処理をメモリ上で実行し、データアクセス速度を向上させます。高速ローダーは、外部ファイルからのデータロードを並列化し、スループットを改善します。これらの機能により、迅速なデータ処理が可能となり、ビジネスの要求に応じた高性能なシステムを提供します。
図9:高速処理(講演資料より)
強固なデータ保護
Enterprise Postgresは、AI用途を含むさまざまな脅威からデータを防御し、不正アクセスを検出するためのセキュリティ機能を提供します。機密管理支援機能、透過的データ暗号化機能などが含まれます。リレーショナルデータベースに加えて、ベクトルデータベースやグラフデータベースを一元管理できるため、これらの強化されたセキュリティ機能を容易に利用できます。
図10:強固なデータ保護(講演資料より)
おわりに
本講演では、RAGシステムをPostgreSQLで開発する際の3つのポイントについて解説しました。PostgreSQLを利用することで、安全かつ簡単にRAGアプリケーションを開発することが可能になります。さらに、弊社のデータベース「Enterprise Postgres」を利用いただくことで、高いセキュリティと利便性を両立させ、RAG開発を強力に支援します。安全な生成AIシステムをより手軽に構築するために、ぜひEnterprise Postgresの導入をご検討ください。
今回のdb tech showcaseでの初登壇は、私にとって非常に貴重な経験となりました。ご清聴くださった皆様、そして温かいフィードバックをくださった皆様に、心より感謝申し上げます。この経験を通じて、技術的な知見だけでなく、情報を「伝える」ことの難しさや楽しさも改めて実感しました。今回の学びを活かし、今後も積極的にイベントに参加して、自身の技術と経験をさらに深めていきたいと考えております。
最後に、このような素晴らしい機会を与えてくださったdb tech showcase運営事務局の皆様、そして支えてくださった全ての方々に深く感謝いたします。本当にありがとうございました!
関連リンク
2025年8月25日公開
富士通のソフトウェア公式チャンネル(YouTube)
-
- 富士通のミドルウェア製品のご紹介や各種イベント・セミナーの講演内容、デモンストレーションなどの動画をご覧いただけます。
- 富士通のミドルウェア製品のご紹介や各種イベント・セミナーの講演内容、デモンストレーションなどの動画をご覧いただけます。
PostgreSQLについてより深く知る
PostgreSQLに興味をお持ちのお客様はこちらのコンテンツもお勧めです。ぜひご覧ください。