OCRとは

OCRとはOptical Character Recognitionの略で、日本語で光学文字認識と呼ばれます。
OCRは、静止画像として読み込んだ手書き文字や印刷された文字(活字)を、文字コードに変換する技術・ソフトウェアです。
現在では、スマートフォンのアプリケーション等としても身近な技術となっています。
富士通フロンテックでは帳票向けのOCRを開発しています。

「Fujitsu AI-OCR Keyword Capture Client Edition」はこちら

コンシューマ向けOCRと企業向け帳票OCRの違いとは?

今般OCRというのは、スマートフォンの翻訳アプリや画像抽出アプリなどを通じて広く知られるところとなりました。
旅行先などでスマートフォンをかざすだけで気軽に翻訳してくれる。手書きメモを簡単にデータ化し他のアプリにコピーできる。日常的にOCRはこのように使い勝手の良い技術として利用されています。
ですが、文字が見えにくいと急激に誤認識をしたりなど安定していないのが実情です。
コンシューマ向けOCRとビジネスで求められる帳票向けOCRの一番の違いはその認識力です。
帳票はビジネスで使用されるため、OCRの認識力は非常に高く求められています。また、処理させる量も一般利用では一回一行程度ですが、帳票では、帳票の項目数×枚数を処理させる必要があり、処理能力も求められます。
そのため、帳票向けOCRは端末をはじめ、専用のシステムが必要となっています。

定義型OCRと定義レスOCR

定義型OCR
各帳票上の対象項目の位置や文字属性などを一つ一つ事前に定義することで、認識力を高めたOCR技術です。
帳票ごとに定義が必要な項目数や位置が異なるため、帳票の数が増えるほど負担が増えていきます。
定義レスOCR
定義型OCRの問題であった帳票別の事前定義を不要にした新しいOCR技術です。
AI技術を用いることで、安定した認識力を発揮するようになりました。
事前定義を必要としなくなったことで多様な帳票にも柔軟に対応することができ、コスト削減にもつながるようになりました。
ページの先頭へ