Pat
J-GLOBAL ID:200903084445761286

音響モデルの話者適応化方法とその装置

Inventor:
Applicant, Patent owner:
Agent (1): 若林 忠
Gazette classification:公開公報
Application number (International application number):1995044430
Publication number (International publication number):1996241092
Application date: Mar. 03, 1995
Publication date: Sep. 17, 1996
Summary:
【要約】【目的】 音響HMMの誤り率を最小化する高性能の音声認識システムの実現。【構成】 多数の話者の音声から学習して作成した不特定話者用音響HMM(隠れマルコフモデル)6を作成して保有し、認識対象話者の音声データ5から特徴パラメータを抽出する特徴パラメータ抽出部1と、不特定話者用の音響HMMのパラメータを認識対象話者の音声に対する尤度が最大になるように最適化する尤度最大化適応化部2と、さらに、尤度を最大にされたパラメータを有する音響HMMのパラメータを認識対象話者の特徴パラメータの時系列音声データとから微分可能な損失関数を定義してその関数が最小になるようにパラメータを選択して識別誤り最小の音響HMMを求める識別誤り最小化適応化部3と、適応化音響HMM蓄積部4を有する。
Claim (excerpt):
音声の音響的特徴を抽出し、その特徴量を統計的にモデル化して、音素、単語その他の認識カテゴリに対応した音響モデルを構成するために、多数の話者の音声を用いて学習した不特定話者用の音響モデルをHMMと略称されている隠れマルコフモデルで表現しておき、認識対象となる話者の音声を用いて、前記不特定話者用音響HMMのパラメータを、認識対象話者の音声に対する尤度が最大となるように最適化する音響モデルの話者適応化方法において、前記認識対象話者の音声に対する尤度が最大になるように最適化された不特定話者用音響HMMのパラメータを認識対象話者の音声に対する認識誤りが最小になるように適応化するステップを有することを特徴とする音響モデルの話者適応化方法。
IPC (3):
G10L 3/00 521 ,  G10L 3/00 531 ,  G10L 3/00 535
FI (3):
G10L 3/00 521 F ,  G10L 3/00 531 K ,  G10L 3/00 535

Return to Previous Page