特許
J-GLOBAL ID:200903008527272935
音声品質適応化装置
発明者:
,
出願人/特許権者:
代理人 (1件):
高田 守
公報種別:公開公報
出願番号(国際出願番号):特願平6-147876
公開番号(公開出願番号):特開平8-016183
出願日: 1994年06月29日
公開日(公表日): 1996年01月19日
要約:
【要約】【目的】 蓄積された音声データを接続して音声合成する編集合成に適用する、音声品質適応化装置の高品質化を目的としている。【構成】 入力音声から、適応化入力音声スペクトルパラメータを出力し参照音声スペクトルパラメータと共に、ラベリング手段を用いて参照音声音素ラベル列と適応化入力音声音素ラベル列を出力する。部分区間決定手段で、適応化入力音声音素ラベル列から入力音声部分区間及び、参照音声部分区間を求める。また、参照音声スペクトルパラメータを参照音声部分区間に基づいて切り出し、部分参照音声スペクトルパラメータを出力する。適応化入力音声スペクトルパラメータを入力音声部分区間に基づいて切り出し、部分適応化入力音声スペクトルパラメータを出力し、部分参照音声スペクトルパラメータとの間でフレーム間の対応付けによりスペクトルパラメータ距離値を計算する。最適区間決定手段でスペクトルパラメータ距離値の判定により最適な参照音声の区間を検出し、変換音声スペクトルパラメータを出力する。
請求項(抜粋):
発声者や発声時期の異なる参照音声と入力音声間の適応化を行い入力音声を参照音声の声質に近づける音声品質適応化装置において、学習データを用いて入力音声の各フレームのスペクトル特徴の適応化を行うスペクトル適応化手段と、音素モデルを用いて前記スペクトル適応化手段の出力である適応化入力音声と参照音声についてそれぞれ音素境界情報を含む音素ラベルを出力する第1及び第2のラベリング手段と、前記第1のラベリング手段によって与えられた適応化入力音声の音素ラベル列から入力音声部分区間を決定するとともに前記第2のラベリング手段によって与えられた参照音声の音素ラベル列より前記入力音声部分区間の音素ラベル列と一致する区間を検出する部分区間決定手段と、前記部分区間決定手段の出力である部分区間情報に基づいて適応化入力音声と参照音声のそれぞれの切り出しを行う第1及び第2の切り出し手段と、前記第1及び第2の切り出し手段により切り出された適応化入力音声と参照音声間の距離値を求める距離値算出手段と、前記距離値算出手段で求められた距離値の判定結果により参照音声の最適区間を選び出す最適区間決定手段と、前記第1の切り出し手段で切り出された適応化入力音声を前記最適区間決定手段により決定された最適区間における参照音声に変換する変換手段と、を備えるようにしたことを特徴とする音声品質適応化装置。
IPC (2件):
前のページに戻る