Skip to main content

Fujitsu

English | 日本語

China

存档内容

注意:该页面为存档页面,其内容可能已过时。

针对大幅面古籍文献的非接触式高精度扫描拼接技术

富士通研究开发中心有限公司

2014-08-18

富士通研究开发中心有限公司(注1)开发了一种用于大幅面古籍文献电子化的非接触式扫描技术。利用便携的非接触式扫描仪多次扫描文献的各个部分,然后通过智能拼接技术合成一幅完整的大幅面古籍文献图像。

和传统的图像拼接技术相比,我们的技术能够有效处理非接触式扫描中文献局部形变带来的图像畸变,同时保证文字和图案在拼接过程中的完整性。非接触式扫描拼接技术能给古籍文献带来最大保护,并提供高精度的扫描结果,是具有很高性价比的古籍数字化解决方案。

【 开发背景 】

中国有5000年的悠久历史,古籍资源非常丰富。2012年最新统计全国各公藏机构收藏古籍文献数量超过5000万册。古籍数字化对于中华文化的传承具有非常重要的作用。目前由于硬件条件的限制,大幅面文献的扫描一直是古籍数字化的一个难点。此外,各个图书馆保存的中国民国时期的书籍和报刊由于已经接近纸张寿命年限,老化非常严重,亟需通过非接触式扫描实现数字化。我们提出的基于图像拼接的非接触式扫描技术能够有效满足上述文献数字化的需求。

【 课题 】

传统图像拼接方法的对象通常是自然场景图像,这些算法通过计算两幅图像之前的全局变换来实现重叠部分的拼接。古籍文献年代久远,文献表面容易产生局部变形和皱褶。传统的图像拼接算法无法处理重叠部分的局部变形,因此无法保证拼接后的图像质量。此外,拼接线如果通过文献中的文字区域,容易导致文字的形变,如何保证文字内容的完整性是衡量拼接算法性能的一个重要标志。

【 开发的方法 】

我们开发的图像拼接算法针对古籍文献进行了有针对性的优化。图一是拼接算法的流程图。对于两次扫描的上侧和下侧图像,首先根据全局特征进行初对齐。然后在重叠区域进行直线和特征点的检测和匹配,并建立图像之间局部渐变的对应关系。在此基础之上提取受光照、视差和纸面变形影响最小的最优拼接线。最后,在保证文字完整性和线条平直性的约束下实现图像拼接。

0818-1
图一:图像拼接算法的流程图

图二显示的是最优拼接线检测的结果,浅红色部分来自上侧扫描图像,浅蓝色部分来自下侧扫描图像。可以看到最优拼接线会自动优先选择背景部分来保证内容的完整性和线条的平直性及连续性。

0818-2
图二:最优拼接线的检测结果

【 将来 】

富士通研究开发中心有限公司将与合作伙伴一起向图书馆等古籍数字化机构推广非接触式古籍扫描拼接技术,并根据客户的反馈进行技术的改善和提高。

【 关于商标 】

所提及的制品名等专有名词为各社的商标或注册商标。


  • [1] 富士通研究开发中心有限公司:

    董事长 佐佐木繁。总公司地址:中国北京市。

关于Fujitsu(富士通)集团

Fujitsu(富士通)是世界领先的日本信息通信技术(ICT)企业,提供全方位的技术产品、解决方案和服务。在全球拥有约162,000名员工,客户 遍布世界100多个国家。我们凭借在ICT领域的丰富经验和实力,致力于与客户携手共创美好的未来社会。富士通集团(东京证券交易所上市代码:6702) 截至2014年3月31日财政年度的合并收益为4.8兆日元(460亿美元)。
如需更多资讯,请浏览:http://www.fujitsu.com

富士通研究开发中心有限公司

富士通研究开发中心有限公司是日本富士通株式会社投资440万美元在中国境内设立的第一家独资法人研发机构。公司的研究领域覆盖了富士通株式会社的所有业务范围,即信息处理、通信、半导体和软件服务4大领域。
公司成立于1998年2月,公司的经营范围涉及多媒体系统的硬件、软件、半导体元器件与材料的技术开发和技术转让,提供相关的技术服务与咨询。
如需更多资讯,请浏览:http://www.fujitsu.com/cn/about/local/subsidiaries/frdc/

信息技术研究部

电话: 电话: 010-59691538(直拨)
邮箱: 邮箱:sunjun@cn.fujitsu.com
公司:富士通研究开发中心有限公司

新闻ID: 2014-08-18
日期: 2014-08-18
公司: 富士通研究开发中心有限公司