機能説明
クレンジング
住所・氏名クレンジング
丁番地など詳細な住所を辞書と比較して、住所の欠落や誤りを補正し、表記を統一します。
過去40年分の住所および変更履歴を含む住所辞書を内蔵し、これまで活用できなかった住所を、最新の住所に変換(注1)できます。
(注1) 住所によっては最新化できないものもあります。
氏名の姓と名の分かち書きができます。
文字列クレンジング
半角/全角変換、全角英字および半角英字の大文字/小文字変換、ひらがな/カタカナ変換、濁音・半濁音の変換、特定文字の除去・付加、文字列の長さ調節を行います。さらに、オープン系のコード系として、シフトJIS / Unicode(UTF-8) / EUCをサポートしており、文字コードの変換も可能です。
法人名クレンジング
会社/団体/自治体などの法人名をクレンジングすることができます。本機能により、法人種別を正式表記に標準化できます。また、法人名辞書をカスタマイズすることにより、より精度の高いクレンジングが可能になります。
置換クレンジング
入力データ内の特定の文字列を置換することができます。本機能により、異体字の補正、省略表記や類似文字の表記を統一できます。
クレンジングAPI
他のアプリケーションからAPI(C,Java)を利用することにより、データに含まれる文字列/氏名/住所/法人名の表記を統一できます。 また、WebサービスAPIを使用して、リモートからクレンジング機能を利用するアプリケーションを作成できます。
名寄せ
マッチングおよび紐付け
完全一致、2文字違い許容、編集距離(文字列の一致率)などの豊富な評価方法により、表記にゆらぎのある重複データを高精度に検出し、独自の技術により高速に紐付けます。
高速なマッチング処理
マッチング対象の絞り込み、並列処理により、処理スピードを大幅にアップしました。また、メモリ上へ展開が難しい数千万件の巨大なデータに対しては、データを自動的に分割してマッチング処理を実施します。
クロスマッチング、漢字氏名とかな氏名のマッチング
電話番号など複数の項目が存在する場合でも、複数の項目の同時比較ができます(クロスマッチング)。また、漢字のよみを自動判別し、漢字氏名とかな氏名、または漢字氏名同士の一致が検出できます。
運用・支援
クレンジング結果ログ出力機能
クレンジングコマンドを実行した際に、クレンジング結果をデータ1件ごとにログへ出力します。このため、大量データの一括クレンジングを行った場合でも、処理結果を確実に確認することができます。また、エラーが発生した場合、エラーの内容や発生箇所、原因まで出力されるため、エラー発生時に迅速な対処が可能です。
クレンジング条件設定機能
クレンジング条件設定機能( 注1)を使用して、クレンジング前後の形式を設定することができます。設定方法は、項目ごとにクレンジング条件をリストから選択するだけの簡単操作です。
(注1) 動作OSはWindowsのみです。
マッチング条件設定機能
マッチング条件(ルール)をGUI画面で簡単に設定できます。
- 文字列の完全一致のほか、1文字違い、2文字違い、文字列の一致率を計算する「編集距離」などの曖昧比較ができます。
- マッチング対象の項目ごとに評価点(スコア)を求めるための重みがつけられます。
- マッチング結果として出力する総合評価点(トータルスコア)の合格値を設定できます。
マッチング結果として合格値以上のペアと評価点の合計が出力されます。
ログ仕分け情報
クレンジングを実施した際に出力されるログを分析するための情報を付加することができます。 付加された情報をキーとして、ログからエラー箇所の抽出や指摘内容を素早く探すことできるため、入力データの修正作業を効率化できます。