Skip to main content

Fujitsu

English | 日本語

China

存档内容

注意:该页面为存档页面,其内容可能已过时。

非接触式书册双页扫描图像变形矫正技术的开发

使用顶置式扫描仪进行书册的双页扫描并生成没有变形的图像

富士通研究开发中心有限公司,株式会社富士通研究所

2013-07-10

富士通研究开发中心有限公司(注1)与株式会社富士通研究所(注2)开发了一种顶置式扫描仪对书册进行双页扫描时所产生的画面变形的矫正技术,通过该技术可以对页面的曲面变形进行恢复从而生成易于读取的图像。

目前已有一些用于矫正书册双页扫描变形的方法。例如,一些使用额外设备的方法需要将特殊图案投影到书面,根据这个图案的变化来估计变形,或者使用两个摄像 头或结构光设备来估计书面变形,然后再进行矫正处理;而仅通过单摄像头进行矫正的方法所得到的文字图像有可能存在显著的横向收缩现象,从而降低内容的易读 性。而本文中所描述的书册变形矫正技术可以准确提取出页面的轮廓线并构建轮廓模型,然后从该模型中估计出书页的三维曲面信息再对图像进行矫正。

通过本技术可以实现仅用单摄像头对书或杂志进行双页扫描即可生成没有变形的易于读取的图像。

详细技术将发表于2013年8月25~29日在美国华盛顿特区召开的第12届文档分析与识别国际会议(International Conference on Document Analysis and Recognition, ICDAR)。

【 开发背景 】

随着近年来平板电脑的迅速普及,用户在何时何地都能阅读电子书的需求也相应增长。但是,用目前普及率较高的小型扫描仪进行书册数字化之前必须要去除装订并作成单页形式,从而带来不便。因此有必要开发一种可直接应用于已装订书册的数字化方法。

【 课题 】

直接对已装订书册进行数字化需要使用非接触式成像设备(例如摄像头)来进行拍摄。但是非接触式成像模式在拍摄书册的双联页时会产生明显的书面弯曲变形现象,从而降低内容的易读性。(图1)。以前存在的方法包括将特殊图案(例如网格)投影到书面,根据这个图案的变化来估计变形,或者使用两个摄像头或结构光设备来估算书面变形,然后再进行矫正处理。但此类方法需要特殊装置导致成本较高。而现有通过单摄像头进行矫正的方法,所得到的的书脊部分的文字可能存在显著的横向收缩现象,导致不便于阅读。

0614-1

图1 书册拍摄例

【 开发的方法 】

此次开发的书册矫正技术为,使用非接触式成像设备(例如顶置式扫描仪或摄像头)对书册进行成像后,从拍摄图像中准确的提取出页面的轮廓线并构建轮廓模型,然后从该模型中估计出书页的三维曲面信息再对图像进行矫正。以下是本技术的特征:

1. 高速度、高精度的书页轮廓线提取技术

从拍摄图像中准确的提取出页面的轮廓线。首先从低分辨率图像中粗略估计出书页的外侧角点位置,并提取出页面的粗略轮廓线,由于分辨率低所以处理速度很快。然后,用高分辨率图像对先前求得的粗略轮廓线做精确调整,从而提取出正确的轮廓线。这样的多尺度处理可以实现高速度并且高精度的页面轮廓线提取。

2. 基于三维曲面估计的变形矫正技术

根据提取出的书页轮廓线估计出三维曲面信息并对图像进行矫正。基于局部轮廓线形状推算出相邻两侧距离桌面的高度差,对于高度差大的、弯曲变形严重的地方需要加大矫正力度;相反,对于高度差小的、弯曲变形小的地方需要缩小矫正力度。由此,可以正确的矫正书脊部分的文字变形,不会使其产生横向收缩现象。

3. 手指区域消除技术

用顶置式扫描仪对书册进行双页扫描时经常需要用手指对书册进行固定,此时手指也会被扫描至页面图像中。因此检测并消除手指区域有助于提高易读性。

以分辨率300dpi读取A4大小的双联页时可以实现以1.3秒的时间完成约90%精度的处理。

0614-2

图2 书籍矫正技术的概要

0614-3

图3 页面边界矫正效果例

【 效果 】

通过此次开发的技术可以对顶置式扫描仪对书册进行双页扫描时所产生的书面变形进行矫正,从而获得易于读取的图像,也无须去除书册的装订。

【 将来 】

富士通研究所将继续提高本技术的精度。

【 关于商标 】

所提及的制品名等专有名词为各社的商标或注册商标。


  • [1] (注1) 富士通研究开发中心有限公司:

    董事长 佐佐木繁、本社 中国北京市。

  • [2] (注2) 株式会社富士通研究所:

    代表取缔役社长 富田达夫、本社 神奈川县川崎市。

关于Fujitsu(富士通)集团

Fujitsu(富士通)是世界领先的日本信息通信技术(ICT)企业,提供着全方位的技术产品、解决方案和服务。在全球拥有约17万名员工,客户遍布世 界100多个国家。我们凭借在ICT领域的丰富经验和实力,致力于与客户携手共创美好的未来社会。富士通集团(东京证券交易所上市代码:6702)截至 2013年3月31日财政年度的合并收益为4.4兆日元(470亿美元)
如需更多资讯,请浏览:http://www.fujitsu.com

富士通研究开发中心有限公司

富士通研究开发中心有限公司是日本富士通株式会社投资440万美元在中国境内设立的第一家独资法人研发机构。公司的研究领域覆盖了富士通株式会社的所有业务范围,即信息处理、通信、半导体和软件服务4大领域。
公司成立于1998年2月,公司的经营范围涉及多媒体系统的硬件、软件、半导体元器件与材料的技术开发和技术转让,提供相关的技术服务与咨询。
如需更多资讯,请浏览:http://www.fujitsu.com/cn/about/local/subsidiaries/frdc/

电话: 电话: 010-59691538(直拨)
邮箱: 邮箱:book-dewarp@ml.labs.fujitsu.com
公司:株式会社富士通研究所
媒体处理系统研究所 图像运算研究部

新闻ID: 2013年7月10日
日期: 2013-07-10
公司: 富士通研究开发中心有限公司, 株式会社富士通研究所