特許
J-GLOBAL ID:200903089617657704

音素データの生成方法及び音声合成装置

発明者:
出願人/特許権者:
代理人 (1件): 藤村 元彦
公報種別:公開公報
出願番号(国際出願番号):特願平11-254312
公開番号(公開出願番号):特開2001-083979
出願日: 1999年09月08日
公開日(公表日): 2001年03月30日
要約:
【要約】【課題】 音声合成(synthesis)を行う際のピッチ周波数に拘わらずに、自然な合成音声が得られる音声合成装置における音素データの生成方法及び音声合成装置を提供することを目的とする。【解決手段】 各音素毎にLPC係数を求めてこれを暫定音素データとすると共に、このLPC係数に基づく第1のLPCケプストラムを求める。次に、音声合成装置のフィルタ特性を上記暫定音素データに応じたフィルタ特性に設定しつつピッチ周波数を段階的に変化させた際にこの音声合成装置によって合成出力された上記ピッチ周波数毎の音声波形信号の各々に基づいて第2のLPCケプストラムを求める。更に、上記第1及び第2のLPCケプストラム間の誤差をLPCケプストラム歪として求める。ここで、上記音素各々の内の同一音素名に属する音素群中の各音素をその音素のフレーム長毎に複数のグループに区分けし、各グループ毎に、そのグループの中から上記LPCケプストラム歪に基づいて最適な音素を選出しこの音素に対応した上記暫定音素データを最終的な音素データとする。
請求項(抜粋):
音素データに応じたフィルタ特性にて周波数信号をフィルタリング処理することにより音声波形信号を得る音声合成装置における音素データの生成方法であって、音声サンプルを音素毎に分離し、前記音素に対して線形予測符号分析を行って線形予測符号係数を求めこれを暫定音素データとすると共に前記線形予測符号係数に基づく線形予測符号ケプストラムを求めてこれを第1線形予測符号ケプストラムとし、前記音声合成装置のフィルタ特性を前記暫定音素データに応じたフィルタ特性に設定して前記周波数信号の周波数を段階的に変化させた際に前記音声合成装置によって得られた前記周波数毎の前記音声波形信号各々に対して前記線形予測符号分析を行って線形予測符号ケプストラムを求めこれを第2線形予測符号ケプストラムとし、前記第1線形予測符号ケプストラム及び前記第2線形予測符号ケプストラム間の誤差を線形予測符号ケプストラム歪として求め、前記音素各々の内の同一音素名に属する音素群中の各音素を音素長毎に複数のグループに区分けし、前記グループ毎に、前記グループの中から前記線形予測符号ケプストラム歪に基づいて最適な音素を選出し、この音素に対応した前記暫定音素データを前記音素データとすることを特徴とする音素データの生成方法。
IPC (2件):
G10L 13/06 ,  G10L 13/00
FI (2件):
G10L 5/04 Z ,  G10L 9/14 L
引用特許:
出願人引用 (6件)
  • 音声合成方法
    公報種別:公開公報   出願番号:特願平8-250150   出願人:株式会社東芝
  • 音声素片選択方法および音声合成装置
    公報種別:公開公報   出願番号:特願平7-060962   出願人:エヌ・ティ・ティ・データ通信株式会社
  • 特開平1-284898
全件表示
審査官引用 (6件)
  • 音声合成方法
    公報種別:公開公報   出願番号:特願平8-250150   出願人:株式会社東芝
  • 音声素片選択方法および音声合成装置
    公報種別:公開公報   出願番号:特願平7-060962   出願人:エヌ・ティ・ティ・データ通信株式会社
  • 特開平1-284898
全件表示

前のページに戻る