特許
J-GLOBAL ID:200903043921378390

音響モデルの話者適応化法

発明者:
出願人/特許権者:
代理人 (1件): 草野 卓
公報種別:公開公報
出願番号(国際出願番号):特願平4-032471
公開番号(公開出願番号):特開平5-232989
出願日: 1992年02月20日
公開日(公表日): 1993年09月10日
要約:
【要約】【目的】 認識性能を高め、計算時間が少なく、しかも適応化学習音声を少なくすることができる。【構成】 多数の話者音声から各認識対象カテゴリごとに、不特定話者用の連続混合確率分布の隠れマルコフモデル(HMM)を作り、その後話者Aの学習音声を入力し、その音声に対する尤度が最大となるように、不特定話者用HMMの各分割重み係数だけを最適化する。例えば不特定話者用のある混合分布HMMが図4Aに示すように音響特徴の分布1、2、3の合成分布4である場合に、話者Aの音声への適応化の結果は図4Bに示すように、図4Aの分布1、2、3の各平均値、共分散は同一だが重み係数だけが適応化により変更される。分布2が特に多くなり、分布1、3が少なくなっている。
請求項(抜粋):
音声の音響的特徴量を抽出し、その特徴量を統計的にモデル化して、音素、単語などの認識カテゴリに対応した音響モデルを構成する方法において、多数の話者の音声を用いて学習した不特定話者用の音響モデルを混合分布モデルで表現しておき、認識対象となる話者の音声を用いて、上記不特定話者用混合分布モデルの各分布の重み係数を、認識対象話者の音声に対する尤度が最大となるように最適化することにより、音響モデルを認識対象話者に適応化することを特徴とする音響モデルの話者適応化法。
IPC (3件):
G10L 3/00 535 ,  G10L 3/00 521 ,  G10L 3/00
引用特許:
審査官引用 (1件)
  • 特開昭62-121288

前のページに戻る