语音合成

介绍三种生成语音的方式


在富士通的语音合成波形处理部主要有三种语音合成方法。
"音节拼接法""语料库法""大型语料库法"
各个语音波形词典的容量不同,所以根据手机、汽车导航系统及语音服务等使用语音合成功能的产品特点,分别使用不同的语音合成方法。

音节拼接法

・语音波形词典:数MB至10MB左右(收录日语中包括五十音、浊音、半浊音等共140个音节)

・特点:稍微有点机械式的声音,但是使用最小限度的声波数据库,可以合成任何句子

・使用实例:手机(RakuRaku Phone)、PDA等


语料库法

・语音波形词典:约100MB至数百MB(收集来自于报纸、杂志等数千篇文章的语音)

・特点:音节之间有衔接,合成声音比较自然

・使用实例:汽车导航、语音向导等


大型语料库法

・语音波形词典:约1GB至数GB(收集数万篇文章的语音,并包含各种抑扬顿挫的发音)

・特长:合成语音自然流畅,听起来如同真人发音

・使用实例:学习教材(e-learning)、公共设施内的广播等


请试听并比较每种合成语音

耳ボタンを押すとサンプルの音声が聞けます
ユニット接続方式の合成音を聞くコーパスベース方式の合成音を聞く大規模コーパスベース方式の合成音を聞く。当社の新方式は聞きやすく、アクセントが自然で肉声に近いのが特長です。