GTM-W5W3BK9
Skip to main content
  1. 首页 >
  2. 关于富士通 >
  3. 公共信息 >
  4. 新闻 >
  5. 新闻存档 >
  6. 2015年 >
  7. 面向通话管理的声纹识别技术

面向通话管理的声纹识别技术

富士通研究开发中心有限公司

北京, 2015-09-15

富士通研究开发中心有限公司开发了一种声纹识别技术。该技术通过分析说话人的语音,对说话人的身份进行校验和鉴别,从而确定该说话人是否为本人或是否为集群中的某个人。更重要的是,该技术可以利用电话语音远程地进行身份识别和验证,从而方便地实现通话的安全管理。

和传统的声纹识别技术相比,我们克服了环境和信道噪声等因素的影响,从语音信号中分离出与说话人相关的特征,从而提高其识别性能、扩展其适用范围。我们的声纹识别技术,其错误率低于3%,声纹比对时间小于0.13s。我们和江苏富士通通信技术有限公司一起,完成了声纹识别技术在监狱亲情电话管理和银行贷款业务中的实验验证。

【开发背景】

声纹识别是生物认证领域的一个重要分支。由于可进行远程操作的独特优势,声纹识别可以广泛应用于银行和证券交易、声控锁、身份证、信用卡等领域和应用场景的身份确认,并成为防欺诈的一个重要手段:

在电话欺诈和电话勒索一类的案件中,最容易获得的证据就是电话录音,通过声纹识别技术,就能根据电话录音获得线索,可以有效缩小刑侦范围,缩短破案周期;

此外,随着互联网金融等业务的广泛开展,活体身份验证已成为远程银行开户及业务办理的重要一环。通过将密码和声纹结合起来,可方便有效的保证银行业务的安全性。

【课题】

传统声纹识别技术,需要计算每一帧语音数据(一般为20ms)在高斯模型上的置信度,因此,识别速度较慢;此外,由于使用了大量的高斯模型,导致声纹的大小比较大(几百k字节)。由于这两个因素的影响,传统的技术不适用于大规模的声纹识别场景。

即使对于小规模人员的声纹识别应用,传统技术依然受限于环境和信道噪声等因素的影响。当声纹注册和识别时所处的场景发生变化(例如安静的办公场景与嘈杂的室外环境)、以及声音采集设备变更时(例如手机与麦克风),环境和信道噪声等因素将引起声纹识别性能的下降,影响声纹识别的可靠性和适用性。

【开发的方法】

如图1所示,声纹模型建模主要由三个模块构成:通用背景模型、模型自适应、特征空间分解。

通用背景模型和模型自适应模块的主要目的是为了解决单个说话人声音数据不足的问题。首先,利用海量的语音数据训练一个高斯混合模型,即通用背景模型(UBM),该通用模型可以形象的看作为一种大众化的、平均化的声音特征;之后,对每个说话人,利用其声音数据对UBM模型进行自适应调整,得到与该说话人对应的特征超向量。

图1、声纹模型建模示意图
图1、声纹模型建模示意图

特征空间分解的目的是消除环境和信道噪声的影响,从而,提取和说话人相关的特征,如图2和3所示。经特征空间分解后,语音特征被分解为说话人无关相关特征、说话人相关特征、信道相关特征等3部分。在声纹比对时,只采用与说话人相关的特征,从而,降低了噪声影响,确保声纹识别的精度。

特征空间分解计算
图2、特征空间分解计算
特征空间分解示意
图3、特征空间分解示意
【结果】

我们与江苏富士通通信技术公司合作,完成了声纹识别技术在监狱亲情电话管理及银行消费信用贷款等领域中的实验验证。

arrow 某监狱电话语音监控系统:
将声纹识别技术应用于监狱的亲情电话中,可以有效杜绝监狱内犯人利用亲情电话的机会同监狱外犯罪份子的联系,大大减轻了狱警对亲情电话的监听负担,提高监狱管理的安全性;
arrow 某银行消费信用贷款:
为防止银行线上贷款业务中冒充他人身份申请多笔贷款的事件,某银行在电话审核环节中采用了富士通的声纹识别技术,以确保申请人的唯一性,从而来断绝冒充他人身份在线骗贷。
【将来】

富士通研究开发中心有限公司将与合作伙伴一起推动声纹识别技术在实验验证阶段后的商业化,并根据客户反馈进行持续的技术改善和提高。

关于Fujitsu(富士通)集团

Fujitsu(富士通)是世界领先的日本信息通信技术(ICT)企业,提供全方位的技术产品、解决方案和服务。在全球拥有约159,000名员工,客户遍布世界100多个国家。我们凭借在ICT领域的丰富经验和实力,致力于与客户携手共创美好的未来社会。富士通集团(东京证券交易所上市代码:6702)截至2015年3月31日财政年度的合并收益为4.8兆日元(400亿美元)。
如需更多资讯,请浏览:http://www.fujitsu.com

关于富士通研究开发中心

富士通研究开发中心有限公司是日本富士通株式会社投资440万美元在中国境内设立的第一家独资法人研发机构。公司的研究领域覆盖了富士通株式会社的所有业务范围,即信息处理、通信、半导体和软件服务4大领域。
公司成立于1998年2月,公司的经营范围涉及多媒体系统的硬件、软件、半导体元器件与材料的技术开发和技术转让,提供相关的技术服务与咨询。
如需更多资讯,请浏览:http://www.fujitsu.com/cn/frdc/

信息技术研究部

电话: 电话: +86-10-5969-1537
邮箱: 邮箱:rjliu@cn.fujitsu.com
公司:富士通研究开发中心有限公司

新闻ID: 2015-09-15
日期: 2015-09-15
城市: 北京
公司: 富士通研究开发中心有限公司