特許
J-GLOBAL ID:200903084445761286

音響モデルの話者適応化方法とその装置

発明者:
出願人/特許権者:
代理人 (1件): 若林 忠
公報種別:公開公報
出願番号(国際出願番号):特願平7-044430
公開番号(公開出願番号):特開平8-241092
出願日: 1995年03月03日
公開日(公表日): 1996年09月17日
要約:
【要約】【目的】 音響HMMの誤り率を最小化する高性能の音声認識システムの実現。【構成】 多数の話者の音声から学習して作成した不特定話者用音響HMM(隠れマルコフモデル)6を作成して保有し、認識対象話者の音声データ5から特徴パラメータを抽出する特徴パラメータ抽出部1と、不特定話者用の音響HMMのパラメータを認識対象話者の音声に対する尤度が最大になるように最適化する尤度最大化適応化部2と、さらに、尤度を最大にされたパラメータを有する音響HMMのパラメータを認識対象話者の特徴パラメータの時系列音声データとから微分可能な損失関数を定義してその関数が最小になるようにパラメータを選択して識別誤り最小の音響HMMを求める識別誤り最小化適応化部3と、適応化音響HMM蓄積部4を有する。
請求項(抜粋):
音声の音響的特徴を抽出し、その特徴量を統計的にモデル化して、音素、単語その他の認識カテゴリに対応した音響モデルを構成するために、多数の話者の音声を用いて学習した不特定話者用の音響モデルをHMMと略称されている隠れマルコフモデルで表現しておき、認識対象となる話者の音声を用いて、前記不特定話者用音響HMMのパラメータを、認識対象話者の音声に対する尤度が最大となるように最適化する音響モデルの話者適応化方法において、前記認識対象話者の音声に対する尤度が最大になるように最適化された不特定話者用音響HMMのパラメータを認識対象話者の音声に対する認識誤りが最小になるように適応化するステップを有することを特徴とする音響モデルの話者適応化方法。
IPC (3件):
G10L 3/00 521 ,  G10L 3/00 531 ,  G10L 3/00 535
FI (3件):
G10L 3/00 521 F ,  G10L 3/00 531 K ,  G10L 3/00 535

前のページに戻る