特許
J-GLOBAL ID:200903010052924465

音声合成装置およびその制御方法

発明者:
出願人/特許権者:
代理人 (1件): 香取 孝雄
公報種別:公開公報
出願番号(国際出願番号):特願平10-164526
公開番号(公開出願番号):特開平11-352997
出願日: 1998年06月12日
公開日(公表日): 1999年12月24日
要約:
【要約】【課題】 音韻継続時間が大幅に長くなった際の音声がより自然な音声に聞こえるように変換し、特に、歌唱合成の音声を肉声に近いビブラートを含んだものにできる音声合成装置およびその制御方法の提供。【解決手段】 音声合成装置10は、テキスト解析部12から供給される各種のデータを用いて合成パラメータ生成部14が音声継続時間に応じて素片辞書16から順次に読み出される音声素片の読出しを複数の音声素片の範囲内および/または基本周波数を中心に所定の範囲内を往復的に繰り返す制御を行って、テキストを解析して得られた読みに対応する音声素片および/または周波数(すなわち、ピッチ)として割り当てて合成パラメータを生成している。これにより、生成された合成パラメータに応じて変動した音声を音声継続時間中に出力させる。
請求項(抜粋):
文字や記号が含まれる情報をテキストとして取り込み、該テキストを少なくとも単語の読みおよびアクセント情報が登録された単語辞書を用いて解析し、この解析で得られたデータと音声の基本単位となる音声素片の登録された素片辞書とを参照しながら、少なくとも音声素片、音の長さである音韻継続時間、音の高さを規定する基本周波数、および音の強さである振幅を含んだ、合成パラメータを生成し、該生成した合成パラメータから生成された波形を重畳して音声に変換してユーザにより指定された速度で出力する音声合成装置において、該装置は、前記テキストを解析して得られた読みに対応する音声素片が前記素片辞書内に登録されている複数の音声素片で表される際に、前記音声継続時間に応じて前記素片辞書から順次に読み出される音声素片の読出しを前記複数の音声素片の範囲内および/または前記基本周波数を中心に所定の範囲内を往復的に繰り返す制御を行いながら、前記合成パラメータを生成する合成パラメータ生成手段を含むことを特徴とする音声合成装置。
IPC (3件):
G10L 5/04 ,  G06F 3/16 330 ,  G10L 3/00
FI (3件):
G10L 5/04 F ,  G06F 3/16 330 K ,  G10L 3/00 H
引用特許:
審査官引用 (6件)
  • 歌声合成装置
    公報種別:公開公報   出願番号:特願平5-296324   出願人:富士通株式会社
  • 音源装置
    公報種別:公開公報   出願番号:特願平3-271183   出願人:ヤマハ株式会社
  • 音源装置
    公報種別:公開公報   出願番号:特願平4-334695   出願人:ヤマハ株式会社
全件表示

前のページに戻る