存档内容
注意:该页面为存档页面,其内容可能已过时。
针对大幅面古籍文献的非接触式高精度扫描拼接技术
富士通研究开发中心有限公司
2014-08-18
富士通研究开发中心有限公司(注1)开发了一种用于大幅面古籍文献电子化的非接触式扫描技术。利用便携的非接触式扫描仪多次扫描文献的各个部分,然后通过智能拼接技术合成一幅完整的大幅面古籍文献图像。
和传统的图像拼接技术相比,我们的技术能够有效处理非接触式扫描中文献局部形变带来的图像畸变,同时保证文字和图案在拼接过程中的完整性。非接触式扫描拼接技术能给古籍文献带来最大保护,并提供高精度的扫描结果,是具有很高性价比的古籍数字化解决方案。
【 开发背景 】
中国有5000年的悠久历史,古籍资源非常丰富。2012年最新统计全国各公藏机构收藏古籍文献数量超过5000万册。古籍数字化对于中华文化的传承具有非常重要的作用。目前由于硬件条件的限制,大幅面文献的扫描一直是古籍数字化的一个难点。此外,各个图书馆保存的中国民国时期的书籍和报刊由于已经接近纸张寿命年限,老化非常严重,亟需通过非接触式扫描实现数字化。我们提出的基于图像拼接的非接触式扫描技术能够有效满足上述文献数字化的需求。
【 课题 】
传统图像拼接方法的对象通常是自然场景图像,这些算法通过计算两幅图像之前的全局变换来实现重叠部分的拼接。古籍文献年代久远,文献表面容易产生局部变形和皱褶。传统的图像拼接算法无法处理重叠部分的局部变形,因此无法保证拼接后的图像质量。此外,拼接线如果通过文献中的文字区域,容易导致文字的形变,如何保证文字内容的完整性是衡量拼接算法性能的一个重要标志。
【 开发的方法 】
我们开发的图像拼接算法针对古籍文献进行了有针对性的优化。图一是拼接算法的流程图。对于两次扫描的上侧和下侧图像,首先根据全局特征进行初对齐。然后在重叠区域进行直线和特征点的检测和匹配,并建立图像之间局部渐变的对应关系。在此基础之上提取受光照、视差和纸面变形影响最小的最优拼接线。最后,在保证文字完整性和线条平直性的约束下实现图像拼接。
图二显示的是最优拼接线检测的结果,浅红色部分来自上侧扫描图像,浅蓝色部分来自下侧扫描图像。可以看到最优拼接线会自动优先选择背景部分来保证内容的完整性和线条的平直性及连续性。
【 将来 】
富士通研究开发中心有限公司将与合作伙伴一起向图书馆等古籍数字化机构推广非接触式古籍扫描拼接技术,并根据客户的反馈进行技术的改善和提高。
【 关于商标 】
所提及的制品名等专有名词为各社的商标或注册商标。
关于Fujitsu(富士通)集团
Fujitsu(富士通)是世界领先的日本信息通信技术(ICT)企业,提供全方位的技术产品、解决方案和服务。在全球拥有约162,000名员工,客户 遍布世界100多个国家。我们凭借在ICT领域的丰富经验和实力,致力于与客户携手共创美好的未来社会。富士通集团(东京证券交易所上市代码:6702) 截至2014年3月31日财政年度的合并收益为4.8兆日元(460亿美元)。
如需更多资讯,请浏览:http://www.fujitsu.com
新闻ID: 2014-08-18
日期: 2014-08-18
公司:
富士通研究开发中心有限公司