特許
J-GLOBAL ID:200903087578370238

話者適応化装置及び音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平6-246140
公開番号(公開出願番号):特開平8-110792
出願日: 1994年10月12日
公開日(公表日): 1996年04月30日
要約:
【要約】【目的】 適応データが少ない場合であっても誤った適応化学習を防止することができ、従来例に比較してより高い音声認識率で音声認識することができるように話者モデルを適応化することができる話者適応化装置、及びそれを用いた音声認識装置を提供する。【構成】 話者適応前後の隠れマルコフモデルのガウス分布の平均ベクトルの移動ベクトルを用いて、話者適応用学習データに基づいて初期話者モデルを話者適応して学習することにより音声認識のための隠れマルコフモデルの話者モデルを計算するための話者適応化装置である。最尤推定法により移動ベクトルを計算し、話者適応用学習データのデータ量に基づいて、計算された移動ベクトルを重み付けして最大事後確率推定法による移動ベクトルを計算し当該移動ベクトルを用いて初期話者モデルを話者適応して学習することにより音声認識のための隠れマルコフモデルの話者モデルを計算する。
請求項(抜粋):
話者適応前後の隠れマルコフモデルのガウス分布の平均ベクトルの移動ベクトルを用いて、話者適応用学習データに基づいて初期話者モデルを話者適応して学習することにより音声認識のための隠れマルコフモデルの話者モデルを計算するための話者適応化装置であって、最尤推定法により上記移動ベクトルを計算する第1の計算手段と、上記話者適応用学習データのデータ量に基づいて、上記話者適応用学習データのデータ量が多くなるほど重みつけの係数を大きくするように、上記第1の計算手段によって計算された移動ベクトルを重み付けして最大事後確率推定法による移動ベクトルを計算する第2の計算手段と、上記第2の計算手段で計算された移動ベクトルを用いて、初期話者モデルを話者適応して学習することにより音声認識のための隠れマルコフモデルの話者モデルを計算する第3の計算手段とを備えたことを特徴とする話者適応化装置。
IPC (4件):
G10L 3/00 535 ,  G10L 3/00 521 ,  G10L 3/00 531 ,  G10L 3/00

前のページに戻る