特許
J-GLOBAL ID:200903037777940976

話者適応化または話者正規化方法

発明者:
出願人/特許権者:
代理人 (1件): 前田 弘 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-251083
公開番号(公開出願番号):特開2000-081893
出願日: 1999年09月06日
公開日(公表日): 2000年03月21日
要約:
【要約】【課題】 話者適応化または話者正規化方法を提供する。【解決手段】 話者一人につきモデル1個の割合で比較的多数の学習用話者200についての話者モデル、適応モデルを学習する。モデルパラメータを所定の順序で抽出して話者一人につき1個の割合でスーパーベクトルの集合を作成する。スーパーベクトルの集合について次元数削減206を実行して固有音声空間208を画定する固有音声の集合を生成する。その後、新たな話者214により提供された適応化用データから最尤推定法に基づいてスーパーベクトルを作成する。スーパーベクトルは固有音声空間内に拘束するように作成する。固有空間内でベイズ推定220を実行すれば、話者空間密度に関する事前の知識を利用して固有空間内の新たな話者の位置に関する推定を向上させることができる。
請求項(抜粋):
複数の学習用話者を表現する固有空間を、前記複数の学習用話者に関するモデルの集合を提供し、そのモデルの集合について次元数削減を実行して前記固有空間を定義する基底ベクトルの集合を生成することによって、作成する工程と、適応モデルの生成を、新たな話者からの入力音声を用いてその適応モデルの学習を行い、かつ、前記基底ベクトルの集合を用いてその適応モデルを前記固有空間内に収まるように拘束しつつ、行う工程とを備える、話者適応化または話者正規化方法。

前のページに戻る