特許
J-GLOBAL ID:200903031430339816

駆動音源コードブックの設計法

発明者:
出願人/特許権者:
代理人 (1件): 富田 和子
公報種別:公開公報
出願番号(国際出願番号):特願平5-003566
公開番号(公開出願番号):特開平6-209262
出願日: 1993年01月12日
公開日(公表日): 1994年07月26日
要約:
【要約】【目的】少ない処理で、確実に好適な基底ベクトルを求める。【構成】複数の学習サンプル空間を備える。そして、適当な学習サンプル空間13から初期基底ベクトル14の集合を抽出する。初期基底ベクトルは重み付け合成フィルタ15で重み付けした後、重み付け長期予測ベクトル12と直交化16する。そして、その後、直交化した基底ベクトルを線形結合17した複数のコ-ドベクトルを生成し、複数の重み付け入力音声11との間の距離の和を求める。そして、求めた距離を評価し18、評価結果に応じて、学習サンプル空間を切り替え、新たな初期基底ベクトルの集合を抽出し、同様な処理を繰り返し、最も重み付け入力音声との間の距離が小さい初期基底ベクトルの集合を最終的な基底ベクトルとして選択する。
請求項(抜粋):
所定の合成フィルタによって所定の長期予測ベクトルにフィルタ処理を施した合成フィルタ出力長期予測ベクトルを入力音声あるいは聴覚重み付けされた入力音声との差が最小となるように探索し、探索した合成フィルタ出力長期予測ベクトルと、あらかじめ定めた複数の基底ベクトルに前記合成フィルタによってフィルタ処理を施した前記合成フィルタ出力基底ベクトルとを直交化した後に、複数の前記基底ベクトルを所定の規則に従いそれぞれ線形に結合した、複数の線形結合ベクトルを出力コードベクトルとする駆動音声コードブックを備え、前記入力音声あるいは聴覚重み付けされた入力音声と直交化された複数の前記基底ベクトルの線形結合との差が最小となる、前記駆動音声コードブックのコードベクトルを探索することにより入力音声を符号化する音声符号化方式で用いる前記駆動音源コードブックを設計する方法であって、複数の学習サンプルを含む学習サンプル空間を求める第1のプロセスと、学習サンプル空間から、複数の学習サンプルの組を複数の仮基底ベクトルの組として抽出するステップと、抽出した各仮基底ベクトルに、前記合成フィルタによりフィルタ処理を施すステップと、あらかじめ定めた複数の入力リファレンス音声あるいは聴覚重み付けされた前記複数の入力リファレンス音声との差が最小となるように探索した、前記合成フィルタによって前記長期予測ベクトルにフィルタ処理を施した合成フィルタ出力長期予測ベクトルと、前記フィルタ処理を施した各仮基底ベクトルとを直交化するステップと、前記直交化された複数の仮基底ベクトルを、前記規則に従い、線形に結合した複数の線形結合ベクトルを求め、各線形結合ベクトルと複数の入力リファレンス音声あるいは聴覚重み付けされた前記複数の入力リファレンス音声との差のうち最小のものの、前記複数の線形結合ベクトルについての和を求めるステップとを含む第2のプロセスと、前記第2のプロセスを仮基底ベクトルの複数の異なる組について繰り返し、最も、前記和が小さかった仮基底ベクトルの組を基底ベクトルの組とする第3のプロセスとを含むことを特徴とする駆動音源コードブックの設計方法。
IPC (3件):
H03M 1/12 ,  G10L 9/14 ,  G10L 9/18
引用特許:
審査官引用 (1件)
  • 特開昭57-087799

前のページに戻る