GTM-MML4VXJ
Skip to main content

English

Japan

  1. ホーム >
  2. やさしい技術講座 >
  3. 全講座一覧 >
  4. 音声合成 >
  5. コンピュータで声を作る流れ

コンピュータで声を作る流れ

コンピュータでは、言語処理、韻律(いんりつ)生成、波形処理をして、音声が合成されます。

(韻律とは、声の高さ、イントネーション、リズム、ポーズなどの喋り方の特徴です)

文章入力後、まず言語処理部では、言語解析を行い、単語辞書を参照して、読み、ま、アクセントをつけます。次に、韻律生成部でイントネーションやリズム決めます。最後に波形処理部で音声波形辞書から音声波形データを選び、滑らかにつなぐことで、音声合成ができあがります。

音声合成用の発音

言語処理部では、漢字やひらがなの混じった文章を音声合成用の発音に変換します。この発音は、私達が普段使っている漢字を読むための「ふりがな」とは違います。例を挙げてみましょう。

漢字ひらがな混じりの文章の接続語の「ハ」は、音声合成用の発音では「ワ」に変換します。同様に「へ」は「エ」になります。また、「トウキョウ」は「トーキョー」に、「ケイタイ」は「ケータイ」と変換します。

ページを移動