特許
J-GLOBAL ID:200903049472555892

音声認識方法,音声認識装置,及び記憶媒体

発明者:
出願人/特許権者:
代理人 (1件): 鈴木 正剛
公報種別:公開公報
出願番号(国際出願番号):特願平8-251649
公開番号(公開出願番号):特開平10-097284
出願日: 1996年09月24日
公開日(公表日): 1998年04月14日
要約:
【要約】【課題】 音声認識における誤認を抑制できる音声認識装置を提供する。【解決手段】 特徴抽出部12で抽出された入力音声の特徴量をキーワード照合部13と音素照合部14に分岐出力する。キーワード照合部13は認識スコアが最大のキーワードを選択的に出力し、音素照合部14は認識スコアが最大の音素を選択的に出力する。連鎖確率演算部15は、キーワード群に含有される音声以外の音声単語に対応する音素が連鎖する連鎖確率を算出する。比較処理部16は連鎖確率演算部15で算出された連鎖確率に基づいて上記音素の認識スコアを修正し、修正後の累計値を算出するとともに、この累計値とキーワードの認識スコアとを比較する。そして、キーワードの認識スコアの方が高ければ、キーワードを認識結果として出力し、累計値が高ければ何も出力しない。
請求項(抜粋):
予め登録されたキーワード群から所定区間における入力音声の特徴に最も類似するキーワードを選択するとともに、選択されたキーワードの類似の度合いを表す第1の認識スコアを算出する過程と、予め登録された音素群から前記区間に含有される個々の音素の特徴に最も類似する音素を選択するとともに選択された各音素の類似の度合いを表す第2の認識スコアを算出する過程と、前記キーワード群に含有される音声以外の音声単語に対応する音素が連鎖する連鎖確率を用いて各音素についての第2の認識スコアを修正するとともに、修正された第2の認識スコアを前記区間内の音素列について累計して第3の認識スコアを算出する過程と、第1及び第3の認識スコアを前記区間毎に比較し、比較結果に応じて当該区間における前記キーワードの出力の可否を決定する過程と、を含むことを特徴とする音声認識方法。
IPC (4件):
G10L 3/00 561 ,  G10L 3/00 531 ,  G10L 3/00 ,  G10L 3/00 571
FI (4件):
G10L 3/00 561 F ,  G10L 3/00 531 D ,  G10L 3/00 531 C ,  G10L 3/00 571 E

前のページに戻る