特許
J-GLOBAL ID:200903097063080224

話者適応化装置及び音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-239819
公開番号(公開出願番号):特開平9-081179
出願日: 1995年09月19日
公開日(公表日): 1997年03月28日
要約:
【要約】【課題】 従来例に比較して移動ベクトルの推定精度を改善することができ、音声認識率を向上することができる話者適応化装置、及びそのHMMを用いて音声認識する音声認識装置を提供する。【解決手段】 話者適応前後のHMMの特徴ベクトルの関係を示す移動ベクトルを用いて、話者適応用学習データに基づいて初期話者モデルを話者適応して学習することによりHMMの話者モデルを計算する。ここで、話者適応された後のHMMの特徴ベクトルをその近傍ベクトルで平滑化処理し、話者適応後のHMMのガウス分布の平均ベクトルを話者適応前のHMMのガウス分布の平均ベクトルの近傍にある近傍ベクトルで補間処理する。平滑化処理と補間処理において、逐次状態分割法による状態分割過程の木構造を用いて、木構造内のあるノードからより下層内のベクトルのうち処理すべき対象ベクトルと近傍ベクトルとの距離の値が小さい上位複数個のベクトルを選択する。
請求項(抜粋):
話者適応前後の隠れマルコフモデルの特徴ベクトルの関係を示す移動ベクトルを用いて、話者適応用学習データに基づいて初期話者モデルを話者適応して学習することにより音声認識のための隠れマルコフモデルの話者モデルを計算するための話者適応化装置において、上記話者適応用学習データが存在して話者適応用学習データに基づいて話者適応された後の隠れマルコフモデルの第1の特徴ベクトルを、当該第1の特徴ベクトルと、その近傍にある話者適応された後の隠れマルコフモデルの複数の第2の特徴ベクトルとを用いて平滑化処理を実行する平滑化手段と、上記話者適応化用学習データが存在せず上記平滑化手段によって計算されなかった話者適応後の隠れマルコフモデルのガウス分布の平均ベクトルを、当該平均ベクトルに対応する話者適応前の隠れマルコフモデルのガウス分布の平均ベクトルの近傍にある上記話者適応用学習データが存在して上記平滑化手段によって計算された話者適応後の隠れマルコフモデルのガウス分布の平均ベクトルの移動ベクトルを用いて補間する補間手段とを備え、上記平滑化手段と上記補間手段は、逐次状態分割法による状態分割過程の木構造を用いて、当該木構造内のあるノードからより下層内のベクトルのうち処理すべき対象ベクトルと近傍ベクトルとの距離の値が小さい所定の上位複数個のベクトルを選択する選択手段を備えたことを特徴とする話者適応化装置。
IPC (2件):
G10L 3/00 531 ,  G10L 3/00 535
FI (2件):
G10L 3/00 531 K ,  G10L 3/00 535

前のページに戻る