GTM-MML4VXJ
Skip to main content

English

Japan

  1. ホーム >
  2. やさしい技術講座 >
  3. 全講座一覧 >
  4. 音声合成 >
  5. 音声を作る方式を3つ紹介

音声を作る方式を3つ紹介

富士通の音声合成の波形処理部には、主な方式が3つあります。
「音節接続方式」「コーパスベース方式」「大規模コーパスベース方式」
それぞれ音声波形辞書の容量が異なるため、携帯電話やカーナビや音声サービスなど音声合成機能が組み込まれる製品の特徴に応じて使い分けられています。

音節接続方式

・音声波形辞書:数MBから約10MB(日本語の50音、濁音、半濁音等約140音の音声を登録)

・特長:少し機械的な音ですが、最小限の音声波形データベースで、どんな文章も合成可能

・利用例:携帯電話(らくらくホン)、PDAなど

コーパスベース方式

・音声波形辞書:約100MBから数100MB(新聞や雑誌等の数千文章の音声を登録)

・特長:音のつながりのある自然な合成音

・利用例:カーナビ、音声案内など

大規模コーパスベース方式

・音声波形辞書:約1GBから数GB(様々な抑揚を含む数万文章の音声を登録)

・特長:自然で肉声感のある人らしい合成音声

・利用例:学習教材(e-learning)、公共施設放送など

それぞれの合成音を聞き比べて下さい

耳ボタンを押すとサンプルの音声が聞けます

ユニット接続方式の合成音を聞く コーパスベース方式の合成音を聞く 大規模コーパスベース方式の合成音を聞く。当社の新方式は聞きやすく、アクセントが自然で肉声に近いのが特長です。

ページを移動