特許
J-GLOBAL ID:200903007730504179

隠れマルコフモデルの学習装置及び音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-232436
公開番号(公開出願番号):特開平9-081182
出願日: 1995年09月11日
公開日(公表日): 1997年03月28日
要約:
【要約】【課題】 従来例に比較して容易にかつ迅速に登録語の語彙を変更してHMMを学習することができるHMMの学習装置及びその学習装置によって学習されたHMMを用いて音声認識する音声認識装置を提供する。【解決手段】 発生された多次元一様乱数を、予め登録された登録語を認識するための所定の単語HMMの多次元ガウス分布に従う複数のガウス乱数に変換して、変換された複数のガウス乱数を複数の特徴パラメータである擬似的な単語学習データとして出力する。次いで、上記単語学習データと、上記単語HMMに基づいて、所定のコスト関数の関数値が最小となるように、予め登録されない未登録語を検出するためのガーベジHMMの複数のパラメータを更新することにより上記ガーベジHMMの複数のパラメータを学習する。さらに、学習されたHMMと、上記単語HMMとを用いて入力された発声音声を音声認識する。
請求項(抜粋):
多次元一様乱数を発生する乱数発生手段と、上記乱数発生手段によって発生された多次元一様乱数を、予め登録された登録語を認識するための所定の単語隠れマルコフモデルの多次元ガウス分布に従う複数のガウス乱数に変換して、変換された複数のガウス乱数を複数の特徴パラメータである擬似的な単語学習データとして出力するデータ生成手段と、上記データ生成手段から出力された擬似的な単語学習データと、上記単語隠れマルコフモデルに基づいて、所定のコスト関数の関数値が最小となるように、予め登録されない未登録語を検出するためのガーベジ隠れマルコフモデルの複数のパラメータを更新することにより上記ガーベジ隠れマルコフモデルの複数のパラメータを学習する学習手段とを備えたことを特徴とする隠れマルコフモデルの学習装置。
IPC (2件):
G10L 3/00 535 ,  G10L 3/00 521
FI (2件):
G10L 3/00 535 ,  G10L 3/00 521 F

前のページに戻る