特許
J-GLOBAL ID:200903018255132522

ワードスポッティング方法

発明者:
出願人/特許権者:
代理人 (1件): 鈴木 誠
公報種別:公開公報
出願番号(国際出願番号):特願平5-056214
公開番号(公開出願番号):特開平6-266386
出願日: 1993年03月16日
公開日(公表日): 1994年09月22日
要約:
【要約】【目的】 入力音声の時刻に同期して高速に且つ精度良く、入力音声中に存在するキーワードを検出する。【構成】 尤度計算部は、音声分析部2からの音声特徴量の時系列を入力し、記憶部7,8の部分単語列を表すキーワードおよびガーベッジ隠れマルコフモデルを用いて、記憶部9に設定されたオートマトンの開始状態から各状態までで受理可能な認識対象単語及び未知語からなる全ての部分単語系列と、音声始端から各時刻までの入力音声の特徴系列との間で、尤度を時刻に同期して逐次求める。事後確率計算部4は、この尤度を用いて、各時刻が認識対象単語を最後尾単語とする各部分単語系列の発声終了の事後確率、各時刻が各部分単語系列の発声途中の事後確率を求める。認識判定部5は、これらの事後確率を時刻毎に比較し、部分単語系列中に存在する認識対象単語を判定する。
請求項(抜粋):
予め、認識対象単語とその他の未知語が出現する順序関係を規定した有限状態オートマトンと、認識対象単語の音声特徴時系列を表すキーワード隠れマルコフモデルおよび未知語の音声特徴時系列や雑音などの非音声の特徴時系列を包括的に表すガーベッジ隠れマルコフモデルを作成しておき、オートマトンの開始状態から各状態までで受理可能な認識対象単語および未知語からなる全ての部分単語系列と、音声始端から各時刻までの入力音声の特徴系列との間で、部分単語列を表すキーワードおよびガーベッジ隠れマルコフモデルを用いて、尤度を時刻に同期して逐次的に求め、上記尤度を用いて、各時刻が認識対象単語を最後尾単語とするような各部単語系列の発声終了である場合の事後確率と、各時刻が各部分単語系列の発声途中である場合の事後確率を算出し、上記事後確率のうちで最大値を示すものが、ある部分単語系列の発声終了である場合に対応する時に、その部分単語系列中に存在する認識対象単語が部分単語系列内での出現順序通りに現れたと認識する、ことを特徴とするワードスポッティング方法。
IPC (4件):
G10L 3/00 531 ,  G10L 3/00 ,  G10L 3/00 521 ,  G10L 3/00 535

前のページに戻る