特許
J-GLOBAL ID:200903099460553239

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-045386
公開番号(公開出願番号):特開平8-241094
出願日: 1995年03月06日
公開日(公表日): 1996年09月17日
要約:
【要約】【目的】 従来例に比較して高い音声認識率で音声認識することができ、しかも安定に動作する連続音声認識装置を提供する。【構成】 入力された単語列からなる発声音声の音声信号に基づいて、所定の音響モデルを参照して、上記発声音声を音声認識する音声認識装置において、上記音響モデルは、単語の隠れマルコフモデルにおいて、単語のバイグラムを挿入してなる音響モデルである。音声認識処理において、各時刻において各音声認識候補の累積尤度を計算し、計算された各音声認識候補の累積尤度のうち最大の累積尤度を有する音声認識候補を最適な音声認識候補として検出し、検出された最適な音声認識候補が認識すべき単語の最終状態であるか否かを判断し、最終状態であるときに音声認識結果の単語として出力する。
請求項(抜粋):
入力された単語列からなる発声音声の音声信号に基づいて、所定の音響モデルを参照して、上記発声音声を音声認識する音声認識手段を備えた音声認識装置において、上記音響モデルは、複数の状態を備え各2つの状態間の状態遷移確率と出力確率とを含む単語の隠れマルコフモデルにおいて、単語のバイグラムを挿入してなる音響モデルであって、上記音声認識手段は、各時刻において各音声認識候補の累積尤度を計算する尤度計算手段と、上記尤度計算手段によって計算された各音声認識候補の累積尤度のうち最大の累積尤度を有する音声認識候補を最適な音声認識候補として検出する比較手段と、上記比較手段によって検出された最適な音声認識候補が認識すべき単語の最終状態であるか否かを判断し、最終状態であるときに音声認識結果の単語として出力する判断手段とを備えたことを特徴とする連続音声認識装置。
IPC (2件):
G10L 3/00 535 ,  G10L 3/00 531
FI (2件):
G10L 3/00 535 ,  G10L 3/00 531 E

前のページに戻る