GTM-MML4VXJ
Skip to main content

Japan

Text Navigator®の特徴

特徴1. 超高速検索

Text Navigatorは、当社独自の高速・省資源の方式で索引情報(サーチクラスタ)のみを保持します。検索の際にText Navigatorで対象を絞り込み、獲得した索引情報でデータベースから情報本体を取得することにより、テキスト情報の超高速検索を実現します。

データベースを直接検索する場合との比較

20万件と100万件の図書データの入ったデータベースから、書名に「政治」と「経済」の入っている図書を検索した場合の所要時間を計測した結果です。

データ総数 ヒット件数 DB直接検索の
所要時間
Text Navigatorを
利用した場合の所要時間
参考:
Text Navigatorの
索引取得所要時間
20万件 97件 13.423秒 0.320秒 0.031秒
100万件 236件 47.127秒 0.762秒 0.040秒

[書名]="政治" and [書名]="経済"
計測方法:同一マシンにおけるクライアント / サーバ構成でのレスポンス

CPU PentiumIII 1GHz
メモリ 512MB
OS Linux
RDBMS Oracle9i

特徴2. 検索中のリアルタイム更新

Text Navigatorは、サーチクラスタをリアルタイム更新(レコードの追加・更新・削除)できます。更新による検索への影響は最小限に抑えており、更新中の検索者にストレスを与えません。

日中のオンライン更新(通常業務)を想定した実測値

登録件数140万件のサーチクラスタに対し、10秒おきに1,000件の更新を繰り返し、あわせて10秒おきに50クライアントからの検索を繰り返すという処理を1時間34分16秒間行った結果です。

  計測時間 実処理時間(注意1) 1件あたり
更新 1,000件 1時間34分16秒 11分06秒 0.66秒
検索(更新中) 28秒 0.06秒

(注意1)実処理時間-waitを除いたText Navigatorの実行時間

検索中のリアルタイム更新の画像

特徴3. 高品質な日本語処理

(1) Happiness®/BASE内蔵

Text Navigatorは、日本語自然文の解析を行う汎用ソフトウェアHappiness/BASEを内蔵し、日本語自然文から意味ある「言葉」としてキーワードを自動抽出します。
抽出したキーワードは、意味のある「言葉」の最小単位(「語基」と呼びます)の組み合わせとして独自の形式に加工し、管理します。これに「語基」の前方一致、後方一致、任意一致などの一致条件を組み合わせることにより、一般的な「形態素解析方式」よりはるかにきめ細かく、漏れの少ない検索を実現します。

一般的な形態素解析方式の漏れ発生例
研究矢印研究所
総務部矢印総務 部長

(2) 形態素解析方式とNグラム方式の両方を搭載

さらにText NavigatorはNグラム方式を搭載しています。Happiness/BASEによるきめ細かい処理にNグラム方式を加えることにより、最高品質の日本語処理を実現します。方式は、データにより選択可能で、同一フィールドに対して併用することもできます。

形態素解析方式の特長
・ノイズが少ない(漏れの発生)
・キーワードによる傾向分析ができる
Nグラム方式のノイズ例
京都
出産
Nグラム方式の特長
・漏れが無い(ノイズの発生)
・索引サイズ大

特徴4. 用語通覧で検索をナビゲート

Text Navigatorは、サーチクラスタに格納された情報を元に用語の通覧を表示できます。元のテキスト情報に含まれる用語を一覧表示するなど、検索支援はもとより、文書情報の傾向分析など、さまざまな用途に知的活用することができます。
通覧方法はいろいろありますが、以下はKWIC通覧(位置付け語(例:政治)を中心にその語基を持つ索引語を一覧)の例です。

  政治  
伝統的 政治  
  政治 システム
  政治 改革
  政治 改革関連法案
参院 政治 改革特別委員会
  政治 改革法案
  政治 改革法案審議
国民 政治 協会

特徴5. 省資源

Text Navigatorは、コンパクトなシステムです。
当社独自の高速検索アルゴリズムで、CPU資源を圧迫しません。

特徴6. 無停止運転

Text Navigatorは、大規模データと長期間に渡るノンストップ運用に対応しています。
サーチクラスタには、2G件(≒21.4億件)まで収録可能。
また、サーバ全体の稼動状況やクライアントセッション単位の状況監視、サーチクラスタのバックアップ及び正規化(更新によって細分化されたサーチクラスタ内部の再配置(デフラグ))を実現しています。

無停止運転の画像

製品やサービスに関しての資料請求・お見積り・ご相談

富士通エフ・アイ・ピー・システムズ株式会社
icon-mail E-mail: fips-product@cs.jp.fujitsu.com