GTM-W5W3BK9
Skip to main content
  1. 首页 >
  2. 关于富士通 >
  3. 公共信息 >
  4. 新闻 >
  5. 新闻存档 >
  6. 2011年 >
  7. 业界首次!成功实现对复杂背景上的多色字幕进行识别

业界首次!成功实现对复杂背景上的多色字幕进行识别

让通过字幕对海量电视节目及网络视频的检索成为可能

株式会社富士通研究所,富士通研究开发中心有限公司

北京, 2011-03-07

株式会社富士通研究所(1)和富士通研究开发中心有限公司(2)成功开发出了从复杂的颜色和背景中成功认识多色字幕的技术。该技术成功突破了现有字幕识别技术中字幕或背景颜色至少有一方是单色的限制.

通过使用该技术,使得从视频画面中提取大量的文字信息变为可能,从而可以更加容易的通过字幕来检索视频。

该项技术被发表于在3月10日举行的电子情报通信学会模式识别及媒体理解研究会上。

20110307-1

图1.视频中的字幕及其识别

开发背景

近年来,视频内容的爆发式增长使得对视频内容的检索技术变得非常重要。由于视频画面中的字幕对视频的内容进行了充分的描述,因此使用字幕对视频内容进行检索的方式被广泛应用于视频内容检索技术中。

课题

现有技术对可识别的视频字幕存在诸多限制: (1)字幕的背景须是单一颜色,同时字幕必须是与之不同的颜色(单色或多色),或者是(2)当字幕背景为多色或复杂颜色时字幕颜色必须为单一颜色。但是近年来图文电视或综合节目中更多的使用了彩色字幕。在这样的复杂背景下,如何准确的提取字幕成为研究开发的难点。

开发的技术

此次开发的技术使得复杂背景上的多色字幕识别成为可能。本技术首先通过颜色将原图像分解成多幅图像,然后对每幅图像进行字幕识别,最后通过对所得结果进行最佳匹配来实现复杂背景上的多色字幕识别(图2)。

20110307-2

图2.多色字幕的识别方式

效果

本技术使得对于以往无法进行字幕识别的视频画面的字幕识别成为可能(表1)。

20110307-3

今后

今后,除将本技术应用到英语等外国语字幕的识别中之外,还将扩展至对移动字幕进行识别。另外,还将进行在视频图像检索方面应用的推广。

此外,对于家电的操作说明视频或观光旅游的风景介绍片等,为方便不同国家的人员视听而进行多语言化的需求在增多,由本技术与机器翻译技术结合而成的视频翻译支持技术有很好的应用前景。

关于商标

所记载的产品名称等固有名词是各公司的商标或注册商标。


  • [1] (注1)

    株式会社富士通研究所:代表取缔役社长 富田達夫、本社 神奈川県川崎市。

  • [2] (注2)

    富士通研究开发中心有限公司: 董事长 佐佐木繁,总公司 中国北京市。

关于Fujitsu(富士通)集团

Fujitsu(富士通)是世界领先的面向全球市场提供行业解决方案的ICT综合服务供应商。
Fujitsu(富士通)拥有大约17万名员工遍布全球70个国家,Fujitsu(富士通)把世界各地的系统服务专家、高度可靠的计算通讯产品和先进的微电子技术结合起来,提供给客户更多的附加价值。富士通集团总部设在东京(东京证券交易所上市代码:6702),截至2010年3月31日财政年度结束时报告的合并收益为4.6兆日元(500亿美元)。
如需更多资讯,请浏览:http://www.fujitsu.com

富士通研究开发中心有限公司

富士通研究开发中心有限公司是日本富士通株式会社投资440万美元在中国境内设立的第一家独资法人研发机构。公司的研究领域覆盖了富士通株式会社的所有业务范围,即信息处理、通信、半导体和软件服务4大领域。
公司成立于1998年2月,公司的经营范围涉及多媒体系统的硬件、软件、半导体元器件与材料的技术开发和技术转让,提供相关的技术服务与咨询。
如需更多资讯,请浏览:http://www.fujitsu.com/cn/about/local/subsidiaries/frdc/

电话: 电话: 044-754-2678(直通)
邮箱: 邮箱:lm-pr@ml.labs.fujitsu.com
公司:株式会社富士通研究所
Software&Solution研究所 言語・Media研究部

新闻ID: 2011年3月7日
日期: 2011-03-07
城市: 北京
公司: 株式会社富士通研究所, 富士通研究开发中心有限公司