Pat
J-GLOBAL ID:200903072734441704

音声認識方法及び装置

Inventor:
Applicant, Patent owner:
Agent (1): 工藤 宣幸
Gazette classification:公開公報
Application number (International application number):1997355273
Publication number (International publication number):1999184494
Application date: Dec. 24, 1997
Publication date: Jul. 09, 1999
Summary:
【要約】【課題】 処理量を増加させることなく、リジェクト精度を向上させる。【解決手段】 隠れマルコフモデルネットワークでなる音響モデルを利用して音声認識を行う音声認識方法及び装置に関する。音響モデルを構成する隠れマルコフモデルネットワークの任意の状態間の状態遷移の起こりやすさを表す状態遷移制約情報をあらかじめ作成して格納しておく。認識処理により得られた局所ゆう度と格納されている状態遷移制約情報との加重和を、入力音声データの各フレーム毎に、隠れマルコフモデルネットワークの各状態に対して算出し、これを全フレームにわたって累積加算した値の最大値を参照ゆう度として算出し、認識処理により得られた認識ゆう度と、参照ゆう度の比較により、入力音声データの棄却判定を行う。
Claim (excerpt):
隠れマルコフモデルネットワークでなる音響モデルを利用して音声認識を行う音声認識方法であって、音響モデルを構成する隠れマルコフモデルネットワークの任意の状態間の状態遷移の起こりやすさを表す状態遷移制約情報をあらかじめ作成して格納しておき、認識処理により得られた局所ゆう度と格納されている状態遷移制約情報とに基づいて、入力音声データの棄却判定に用いる参照ゆう度を算出し、認識処理により得られた認識ゆう度と、上記参照ゆう度の比較により、入力音声データの棄却判定を行う音声認識方法において、あらかじめ作成して格納しておく状態遷移制約情報が、以下のステップa1〜ステップa2で作成されたものであることを特徴とする音声認識方法。(ステップa1)音響モデルを構成する隠れマルコフモデルネットワークの全状態に対するクラスタリングを行い、生成された状態クラスタにおける各状態間の遷移接続に基づいて、状態クラスタ間の遷移の起こりやすさを表わす尺度である状態クラスタ間の遷移確率の初期値を算出する。(ステップa2)状態クラスタ数と同数の状態を有する、任意の状態間に遷移接続を有する隠れマルコフモデルネットワークであるエルゴディック隠れマルコフモデルネットワークを構成し、その状態遷移確率パラメータに上記状態クラスタ間の遷移確率の初期値を、また、出力確率分布パラメータに各状態クラスタを代表する状態の出力確率分布をそれぞれ対応させ、このようにして作成したエルゴディック隠れマルコフモデルネットワークを、音声データを用いて学習することによって得られる状態遷移確率を、状態クラスタ間の遷移確率の推定値とし、隠れマルコフモデルネットワークの各状態がどの状態クラスタに属するかを示す情報を付加して状態遷移制約情報とする。
IPC (4):
G10L 3/00 535 ,  G10L 3/00 531 ,  G10L 3/00 ,  G10L 3/00 561
FI (4):
G10L 3/00 535 ,  G10L 3/00 531 P ,  G10L 3/00 531 D ,  G10L 3/00 561 A

Return to Previous Page