文字识别技术

在线文字识别的原理


原理

介绍 “研究所”这三个手写体文字的识别原理。

(1)输入手写体文字“研究所”。

(2)手写体文字被分成可以成为单独文字的几部分。

(3)根据这几部分,从离线文字识别和在线文字识别中选择词典中具有可能性的候补文字。 

(4)考虑文字之间的“连贯性”。

(5)选择最可行的文字排列。

(6)选出“研究所”这三个字的文字排列。


(1)输入手写体文字“研究所”。

(2)手写体文字被分成可以成为单独文字的几部分。
比如说,研究所的“研”字的左右部分都能成为1个单独文字,所以左右两部分也被分开。

(3)根据这几部分,从离线文字识别和在线文字识别中选择词典中具有可能性的候补文字。

  • 离线文字识别与书写笔顺无关,只根据字形判断。
  • 在线文字识别利用记有书写笔顺的词典,根据书写文字时的笔头动作来判断。
    (手写输入时,需要注意笔画顺序)
まずパーツごとに文字の候補を選んで、次にパーツ同士のつながり方の候補を選びます。これらの候補を使って文字の並びの組合せを考えます。

(4)考虑文字之间的“连贯性”。与登录的词典相比较。

(5)选择最可行的文字排列。

(6)最后,“研究所”这个文字列被选出。


富士通研究所在线文字高识别率的理由

文字识别根据电脑中登录的词典,建议可行的候补文字,从中选择可能性最大的文字。此时,比仅仅起离线或在线的某一方提供候补,双方同时提供候补文字,再从中选择最正确文字的话,识别率会更高。

<离线文字识别的优点>
即使书写笔顺不同,只要写出的文字字型一致,就能识别。

<在线文字识别的优点>
即使像行书那样字迹潦草,因为按照笔顺进行判断,所以也能识别。


上一页      1       2       3       4       5       6       7       8     9     10       11       12      下一页