特許
J-GLOBAL ID:200903004127621137

声質変換音声合成装置

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-051039
公開番号(公開出願番号):特開平8-248994
出願日: 1995年03月10日
公開日(公表日): 1996年09月27日
要約:
【要約】【目的】 異なる話者間のスペクトルの差が大きくなりすぎないように変換元話者を選択し、少量の学習データで学習することにより声質変換することができる声質変換音声合成装置を提供する。【構成】 複数の登録話者の音響特徴パラメータを含む音声データベースを予め記憶する。入力された目標話者の少なくとも1単語の音声信号に基づいて、声質変換をすべき目標話者に最も近い話者を、複数の登録話者の中から選択し、選択された話者の音響空間と目標話者の音響空間との間の差分を計算することにより、選択された話者から目標話者への写像コードブックを計算する。入力された文字列に基づいて、音声データベースに記憶された選択された話者の音声の音響特徴パラメータを選択話者のコードブックを用いて量子化して、文字列に対応する目標話者の音声信号の音響特徴パラメータを生成し、文字列に対応する目標話者の音声信号を発生して出力する。
請求項(抜粋):
複数の登録話者の音響特徴パラメータを含む音声データベースとそのコードブックを予め記憶する記憶手段と、入力された目標話者の少なくとも1単語の音声信号に基づいて、声質変換をすべき目標話者に最も近い話者を、上記複数の登録話者の中から選択する選択手段と、上記選択手段によって選択された話者の音響空間と目標話者の音響空間との間の差分を計算することにより、選択された話者から上記目標話者への写像コードブックを計算する生成手段と、入力された音声合成すべき文字列に基づいて、上記音声データベースに記憶された上記選択された話者の音声の音響特徴パラメータを上記選択された話者のコードブックを用いて量子化し、上記選択された話者のコードブックと上記写像コードブックの対応関係に基づいて上記文字列に対応する目標話者の音声信号の音響特徴パラメータを生成する写像処理手段と、上記写像処理手段によって生成された目標話者の音声信号の音響特徴パラメータに基づいて、上記文字列に対応する目標話者の音声信号を発生して出力する音声合成手段とを備えたことを特徴とする声質変換音声合成装置。
IPC (4件):
G10L 9/14 ,  G10L 3/02 ,  G10L 9/18 ,  H03M 7/30
FI (4件):
G10L 9/14 G ,  G10L 3/02 A ,  G10L 9/18 E ,  H03M 7/30 Z

前のページに戻る