语音合成
介绍三种生成语音的方式
在富士通的语音合成波形处理部主要有三种语音合成方法。
"音节拼接法"、"语料库法"、"大型语料库法"
各个语音波形词典的容量不同,所以根据手机、汽车导航系统及语音服务等使用语音合成功能的产品特点,分别使用不同的语音合成方法。
音节拼接法
・语音波形词典:数MB至10MB左右(收录日语中包括五十音、浊音、半浊音等共140个音节)
・特点:稍微有点机械式的声音,但是使用最小限度的声波数据库,可以合成任何句子
・使用实例:手机(RakuRaku Phone)、PDA等
语料库法
・语音波形词典:约100MB至数百MB(收集来自于报纸、杂志等数千篇文章的语音)
・特点:音节之间有衔接,合成声音比较自然
・使用实例:汽车导航、语音向导等
大型语料库法
・语音波形词典:约1GB至数GB(收集数万篇文章的语音,并包含各种抑扬顿挫的发音)
・特长:合成语音自然流畅,听起来如同真人发音
・使用实例:学习教材(e-learning)、公共设施内的广播等