特許
J-GLOBAL ID:200903050003585916
音声認識方法およびそのモデル設計方法
発明者:
,
出願人/特許権者:
代理人 (1件):
磯村 雅俊
公報種別:公開公報
出願番号(国際出願番号):特願平9-086486
公開番号(公開出願番号):特開平10-282986
出願日: 1997年04月04日
公開日(公表日): 1998年10月23日
要約:
【要約】【課題】高性能の音声認識が可能な話者適応型の音声認識システムを、マイクロコンピュータで効率的に実現する。【解決手段】老若男女等の話者の特質毎に分類した音声サンプルを用いて、カテゴリ毎に最適な出力関数を決定し、その出力関数を用いて全体の出力関数を決定し、各分類ごとのHMMの出力確率と、話者の属性確率から、話者の属性に合わせた音声認識を実現する。また、この話者分類による認識を推定スコアの算出に用いて、高性能な音声認識を実現する。さらに、この出力確率の計算および推定スコアの算出を、曖昧推論を用い、かつ領域区分法・変数分離法によって高速化する。
請求項(抜粋):
隠れマルコフモデル(HMM)を用いた音声認識方法のうち、HMMの出力確率を確率密度関数(出力関数)で定義する連続分布型HMMを用いた音声認識システムのモデル設計方法であって、老若男女等の話者の特質ごとにカテゴリーに分類したサンプルを用いて学習し、各カテゴリごとに最適な出力関数を決定する第1のステップと、該第1のステップで決定された各カテゴリーごとの出力関数を用いて、全体の出力関数を決定する第2のステップとを有することを特徴とする音声認識システムのHMMモデル設計方法。
IPC (3件):
G10L 3/00 535
, G10L 3/00 531
, G10L 9/10 301
FI (3件):
G10L 3/00 535
, G10L 3/00 531 K
, G10L 9/10 301 C
前のページに戻る