特許
J-GLOBAL ID:200903086295583980

音声合成方法、その装置及びプログラム記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 草野 卓
公報種別:公開公報
出願番号(国際出願番号):特願平9-239745
公開番号(公開出願番号):特開平10-143196
出願日: 1997年09月04日
公開日(公表日): 1998年05月29日
要約:
【要約】【課題】 入力音声素片を、そのピッチと異なるピッチの良品質の合成音声を得る。【解決手段】 音声素片と同一のピッチF0 レンジのデータを学習データとしてスペクトル包絡の基準コードブックCBM を作り、F0 より高いレンジの同一学習データを、低いレンジの同一学習データを、これと音声素片F0 レンジの学習データとの間で、線形伸縮マッチングを行って、前記CBM の各ベクトルコードごとにスペクトル包絡をクラスタリングして、高レンジコードブックCBH 、低レンジコードブックCBL を作り、CBM とCBH 及びCBL の各対応コードベクトルの差分ベクトルよりなるコードブックCBMH、CBMLをそれぞれ作り、入力音声素片のスペクトル包絡を前記CBM でファジーベクトル量子化しS402、量子化コードを合成ピッチに応じてCBMH又はCBMLで復号し、復号差分ベクトルを、合成音声とCBM の原音声とのピッチの差に応じて伸縮させ、伸縮されたものに入力音声スペクトル包絡を加算した後、逆FFTを行う。
請求項(抜粋):
入力音声を、その基本周波数と異なる所望の基本周波数で音声を合成する音声合成方法においてあらかじめ基本周波数レンジの違う学習用音声データから、基本周波数とスペクトル包絡の関係を求めておき、上記所望の基本周波数の上記入力音声の基本周波数からのずれ量に応じて、上記基本周波数とスペクトル包絡の関係を選択し、その選択した基本周波数とスペクトル包絡との関係を用いて上記入力音声のスペクトル包絡に変形処理を施すことを特徴とする音声合成方法。
IPC (2件):
G10L 7/02 ,  G10L 5/04
FI (2件):
G10L 7/02 D ,  G10L 5/04 F
引用特許:
審査官引用 (2件)
  • 特開昭56-055999
  • 特開平1-237600

前のページに戻る