特許
J-GLOBAL ID:200903048279676309

音響モデルの適応化法

発明者:
出願人/特許権者:
代理人 (1件): 草野 卓
公報種別:公開公報
出願番号(国際出願番号):特願平6-264097
公開番号(公開出願番号):特開平8-123465
出願日: 1994年10月27日
公開日(公表日): 1996年05月17日
要約:
【要約】【目的】 少ない学習音声、少ない計算量で認識率を高くする。【構成】 不特定話者用学習音声を用いて、半連続分布HMMモデルを作り、その基底分布をコードブック15に記憶しておき、各音素についての、各基底分布に対する重み係数を重み係数メモリ16に記憶しておき、また各音素とは独立の全音素についての重み係数を全音素モデル用重み係数19として記憶しておく、認識音声の学習音声を入力して、全音素モデル用重み係数19を用いて、コードブック15の各基底分布のみを適応化してコードブック17を格納する。認識時には入力音響をコードブック17と重み係数メモリ16の重み係数とを用いて認識する。
請求項(抜粋):
学習用音声を用いて、その音声の音響的特徴量を抽出し、その特徴量を統計的にモデル化して、認識カテゴリに対応した音響モデルを、認識時に、上記学習用音声と性質を異にする音声を用いて適応化する方法において、上記音響モデルは、パラメータ空間を複数の基底分布で表現したコードブックと、そのコードブック中の各基底分布に対する重み係数とにより構成し、各認識対象カテゴリと独立に学習した全カテゴリ音響モデルを用いて、上記パラメータ空間を表現する基底分布を、上記性質を異にする音声により再推定して適応化することを特徴とする音響モデルの適応化法。
IPC (4件):
G10L 3/00 521 ,  G10L 3/00 531 ,  G10L 3/00 ,  G10L 3/00 535

前のページに戻る