Skip to main content

Fujitsu

Japan

アーカイブ コンテンツ

注:このページはアーカイブ化さたコンテンツです。各論文の記載内容は、掲載開始時の最新情報です。

雑誌FUJITSU

1998-1月号 (VOL.49, NO.1)

富士通の最新技術を隔月に紹介する情報誌です。 冊子体の販売はしておりませんのでご了承下さい。


雑誌FUJITSU 1998-01

年頭ご挨拶

特集1: 「GRANPOWERシリーズ」 特集2: 「音声合成・認識技術」

特集1: GRANPOWERシリーズ目次〕

  • 特別寄稿 サーバシステム開発への取り組み
  • GRANPOWER 5000 シリーズの高速化技術
  • GRANPOWER 5000 シリーズの実装構造面における高信頼性技術
  • GRANPOWER 6000 シリーズのハードウェア
  • GRANPOWER 6000 シリーズの高速化技術
  • GRANPOWER 7000 シリーズの高性能化技術
  • GRANPOWER 7000 シリーズの高信頼化技術
  • GRANPOWERシリーズのソフトウェア:SymfoWARE

特集2: 音声合成・認識技術目次〕

  • 音声合成・認識技術の進展
  • 高品質音声合成技術
  • 音声合成アプリケーション開発キット
  • 音声合成を用いた電話情報サービス構築ツール:VoiceScript
  • ホームユース向け音声合成ソフトウェア
  • カーナビゲーション用音声合成システム
  • 連続音声認識技術
  • 雑音環境下における音声認識技術
  • マイクロホンアレイを用いた音声入力インタフェース
  • マルチモーダルインタフェースにおける音声合成・認識の利用

一般

  • 統合OASYSの開発

特集1: GRANPOWERシリーズ


PCサーバのシステム性能において重要な要素はプロセッサ,チップセット,I/Oコントローラである。富士通のGRANPOWER5000シリーズではそれぞれのシステム規模に適したプロセッサを採用して,性能やプライスパフォーマンスの優れた製品を提供した。また最新のサーバ,モデル570では,大型コンピュータで培ったシステム高性能化技術,とくにメモリコントローラやI/Oコントローラの高速化技術を適用した独自チップセットを使用し,従来の製品に比べ20%ものシステム性能の高速化を達成した。

藤巻 秀明

PCサーバはオフィスサーバ用途から大規模基幹システムのデータベースサーバへと大きく変貌をとげ,その市場は急速に拡大しつつある。それに伴い,PCサーバにはオフィス環境下での幅広い機能と柔軟性,そして高い信頼性が求められている。24時間稼働が常識となりつつあるPCサーバにおいて,システムダウン時間を最小限に止めることは重要な課題である。また,システムの保守やアップグレードは,導入先のシステム管理者や作業者が行うことが多いため,筐体構造は簡単で作業しやすく,安全かつ高い信頼性が確保されたものでなければならない。
GRANPOWER5000シリーズではこれらの課題に取り組み,筐体の実装構造に関し,電源ユニットの二重化や HDD の活性保守,各デバイス類の温度上昇抑制,さらにシステム保守性の向上,省スペース化等のオフィス環境に対応した高信頼性を達成した。

三五 徹

近年,ネットワークコンピューティングの普及により,今まで単独システムで使われていたビジネスサーバはネットワーク内において基幹系アプリケーションサーバへと位置付けを変えている。
GRANPOWER6000シリーズは,富士通ビジネスサーバの最新鋭モデルである。最先端Pentium Proプロセッサを搭載し,OSを含めた従来機の資産を完全継承し,拡大するカバーレンジにも統一したアーキテクチャで対応可能とした。また従来機で培った高信頼性ノウハウを継承し,さらなる機能追加も行っている。
本稿ではGRANPOWER6000シリーズのプロセッサ変更に伴う資産の継承と高信頼性機能に関する技術を中心に説明する。

武居 正善,池島 裕之,荒木 悟

GRANPOWER6000シリーズは最新Pentium Pro (注1) プロセッサを採用した高性能,高信頼な最新鋭ビジネスサーバであり,今後のPentium Proプロセッサの性能強化にタイムリに対応していく。従来からのアプリケーションプログラム資産はオブジェクトレベルで完全互換である。OSについても従来機と完全互換をとっており,従来機と同等な環境で使用できる。
独自プロセッサからPentium Proプロセッサに変更し,かつOS以上の層を保証するためにGRANPOWER6000シリーズではシステムアーキテクチャをエミュレーションする層を新たに開発した。またOS制御命令のエミュレーションでは,最先端テクノロジである動的オブジェクト変換技術を開発し,性能改善を実現した。
本稿ではGRANPOWER6000シリーズの高性能化の中心技術である動的オブジェクト変換技術を中心に説明する。

小谷田 重則,平井 義郎,和田 美加代

64ビットSPARCプロセッサを採用し,基幹業務システム構築に必要なスケーラブルな性能と信頼性をより高い次元で実現したUNIXビジネスサーバGRANPOWER7000モデル400/600について述べる。モデル600では,最大8CPU,8wayのメモリをクロスバスイッチで接続し,各CPUの独立動作性を高い次元で確立した。これによって,最小1CPUから最大8CPUまでのきわめてリニアなスケーラビリティを実現し,世界最高レベルのシステム性能を達成した。また,信頼性についても,メモリバスに加えて,CPUやIOチャネルとのデータの授受やDTAG(キャッシュ状態監視用制御メモリ)にもECC(Error Check and Correct)を採用するなど,高い信頼性を確保した。

牟田 俊之

基幹業務を構築するのにふさわしい信頼性を実現した,UNIXビジネスサーバGRANPOWER7000シリーズの高信頼化技術について述べる。
GRANPOWER7000シリーズでは,高信頼化のための差別化機能である,メインプロセッサとは独立したプロセッサでシステム監視を行うSCF(システム監視機構:System Control Facility)を中心に,より高い可用性を目指し,耐故障性の向上,監視機能の強化を重点に開発した。
耐故障性の向上では,ファン,電源ユニットを冗長化し活性交換を可能とした。また監視機能の強化では,内部温度,環境温度,CPUの監視を強化した。

結城 和博,佐藤 陽一,市橋 哲彦

SymfoWARE Serverは,あらゆるコンテンツを一元管理できるハイブリッド・データベースとしてリレーショナルデータベースとオブジェクトデータベースを融合させた富士通のデータベースシステムである。1993年10月に販売を開始し,UNIXサーバ(GRANPOWER7000シリーズ,Sファミリーなど,ビジネスサーバ(GRANPOWER6000シリーズなど),PCサーバ(GRANPOWER5000シリーズなど)を合わせて約5,000セットのシステムが稼働している。
本稿では,ネットワークコンピューティング時代の情報システムに課せられる厳しいシステム要件に,完全に応えるSymfoWARE Serverについて説明する。

高崎 喜久夫,斉藤 一彦,今村 浩一

特集2: 音声合成・認識技術


本稿では,今回の音声特集号に掲載された各論文の理解を助けるために,音声,音声合成および音声認識に関する基本的な知識について概説する。まず,音声に関する用語について解説し,つぎに音声合成・認識技術に関して,その分類,処理の概要,現状の性能,今後の課題について触れる。
最後に,技術の利用に関しては,録音再生をテキスト音声合成に,あるいはスイッチを音声認識に単に置き換えただけでは,そのアプリケーションは全く役に立たたず,録音再生やスイッチにはないテキスト音声合成や音声認識固有の機能に着目することが重要であることについて述べる。音声技術を利用する際のこの観点は,録音再生の品質に近いテキスト音声合成,あるいは高認識率の音声認識を目指すという音声技術のこれまでの研究者が持っている観点とは全く異なるものである。

木村 晋太

富士通の高品質音声合成技術について述べる。
基本となるテキスト合成処理では,約12万5千語の大語彙を格納した単語辞書と,新しい単語解析アルゴリズムであるDP照合法により,漢字仮名混じり文を正確に読み上げ,独自に開発した波形編集方式を用いて自然で明瞭な音声を生成する技術を開発した。
読み精度をさらに向上させるため,日本語文章に含まれる英単語を適切に読み上げる英単語日本語読み辞書約1万4千語と,固有名詞を正確に読み上げる住所辞書約15万語,氏名辞書36万語を開発した。
さらに,合成音声を使ったサービスに多く見られる,定型で文中の固有名詞や数量が可変な文について,その韻律(イントネーションやポーズの取り方)の自然性を向上させる「韻律はめこみ方式」を紹介する。

片江 伸之,加世田 光子,木村 晋太

本開発キットは,アプリケーションプログラムに日本語音声合成の機能を提供することを目的としている。
本稿では,音声合成アプリケーション開発キットで提供する音声合成ライブラリに焦点を当てる。音声合成ライブラリは,三つの処理(言語処理,波形処理,辞書管理)から構成されており,それぞれの処理の概要を中心に説明する。

渡 正一,福嶌 孝浩

ネットワークを取り巻く環境はさらに進化し,電話を利用したCTI(Computer Telephony Integration)市場が活発化している。その中でもIVR(Interactive Voice Response)分野が大半を占めている。電話はどこにでもある情報インフラとして整備されており,手軽に利用できる。さらに,携帯電話やPHSは一人一台時代を迎え新しいアプリケーションの開発が進められている。また,ホストコンピュータに蓄積された情報を即座に話言葉として音声変換することが望まれていた。
このような背景から,録音音声をつなぎあわせてサービスしていた音声応答機能に加え,自然なアクセントを出力する音声合成を使った音声FAX応答統合システム(Voice-Script)を開発した。これにより,オープンな環境で生産性の高いシステムが短時間で開発できるようになった。

辻内 秀敏

パソコンと音声合成技術の進歩は,手軽に音声合成を利用できるようにした。今や,多くのソフトウェアが,音声合成機能を組み込み始めている。本稿では富士通が,ホームユース向けに開発した音声合成ソフト「おしゃべりメイト」をとおして,富士通のホームユース向け音声合成ソフトの取り組みについて紹介する。まず,開発の背景を述べ,ホームユース市場における要件を挙げる。つぎに音声合成の用途を紹介し,最後に利用者の要望を紹介する。

鯨岡 信夫,新藤 晃

車載機器の高機能化に伴い,いかにドライバにとって安全で使いやすいヒューマンインタフェース(HI)を構築するかが課題となっている。
著者らは,運転中のドライバに対して安全に情報を提供する手段として,視点移動を伴わない音声を用いたHIに着目し,音声合成技術の開発を行っている。
今回,車載機器への音声合成技術の搭載を目的とし,カーナビゲーション用の音声合成システムを開発した。
本稿では,カーナビゲーション用音声合成システムの概要と特長について報告する。

藤本 博之,高島 淳行

本稿では,文や単語列といった連続音声を認識する技術について述べる。
連続音声認識は孤立単語認識を基礎としているので,最初に孤立単語認識の技術について概説する。つぎに,一般的な連続音声認識技術の概要と連続音声認識の最大の問題である認識にかかる計算量を減らす方法について説明する。著者らは文モデルを単語モデルで構成されるツリーとして実現し,そのツリー探索にベスト・ファースト・サーチを使うことにより計算量を削減した。さらに「ケース・フラグ伝播法」と呼ばれる文認識技術を開発した。この技術は係り受け文法に基づいていて,日本語の文の認識に用いるのに適している。本稿の最後に,実験結果を示す。語彙100単語の孤立単語認識の認識率は97.3%であり,係り受け文法に基づく連続音声認識の意味理解率は98.0%であった。

小島 英樹,岩見田 均

音声認識を実際の環境で使用する際に雑音が大きな問題となる。本稿では,雑音混じりの音声から,発話した内容を認識する技術について述べる。まず,雑音対策を行わない音声認識システムで,雑音の影響による認識性能劣化の状況から,雑音対策の必要性を示した後に,雑音対策のおおまかな分類と実現方法の例について述べる。さらに,不特定話者単語音声認識システムの雑音対策として,推定した雑音パターンを雑音混じりの音声から差し引く方法を紹介し,実際に雑音下で発話された大量の音声データを用いた単語音声認識実験を行って,雑音対策が認識性能の向上に効果があることを示す。

岩見田 均,木村 晋太

本稿では,マイクロホンアレイによる音源位置検出処理と目的音強調処理を用いた音声入力インタフェースについて説明する。
このインタフェースは,雑音のある環境において,(a)あらかじめ定めた位置で話者が発声しているか否かを検出し,(b)発声しているときにのみ,その音声を明瞭に受音し,発声していない場合には無音にするという特長を持つ。今回は,3個のマイクロホンから成るアレイを用いて,音源位置検出処理による音声スイッチと目的音強調処理による指向性マイクロホンを構築し,これらを結合して必要な機能を実現した。実験の結果,音源位置検出処理により話者が発声しているかどうかを検出し,発声している場合に目的音強調処理により音声強調を行い,発声していない場合には無音にできることを確認した。

松尾 直司,北川 博紀,長田 茂美

本稿では,様々な種類のコンピュータへの入力を統一的に扱うことができるように開発した,マルチモーダルインタフェースシステムの概要について紹介し,マルチモーダルインタフェースにおける音声合成・認識の役割について述べる。このマルチモーダルインタフェースシステムの開発に当たって,二つのキー技術を開発した。一つは,入力デバイスに依存しないコンピュータへの入力コマンド(HyperWord)であり,もう一つは,各デバイスからHyperWordへの変換のための入力デバイスの環境設定を記述する入力環境記述言語HCL(Hyper Communication Language)である。このシステムを用いれば,ユーザは,例えば「メール」,「読む」などを示す言葉やジェスチャを入力するだけで,簡単にメールを読むことができる。メールを読むためのアプリケーションはシステムが自動的に起動する。

岡林 桂樹

一般


OASYSシリーズは,ワープロ専用機として分かりやすい操作性や高い日本語処理機能が評価されてきたが,パソコンの爆発的な普及と,オープン化が進む今日,快適な操作環境の提供とオープン環境への対応を迫られている。一方,Windows上で動作するOASYS/Winは,専用機の長所を生かしながら,WYSIWYGやOLEのサポートなど先進的技術を取り入れ,Windows上のワープロソフトの地位を確立してきた。
今回OASYS V5では,上記の二つの流れを統合し,OASYS専用機とWindowsの文化の継承,全般的な操作性改善や快適性の追求,インターネット/イントラネット環境への対応と日本語処理機能の強化を中心に開発を行った。
本稿では,ワープロの利便性とパソコンの汎用性の両方の機能を兼ね備えた,OASYS V5の新技術と新機能について述べる。

野島 伸一,荒井 淳子


---> English (Abstracts of Papers)