特許
J-GLOBAL ID:200903042530841057

音声認識方法およびその装置

発明者:
出願人/特許権者:
代理人 (1件): 大塚 康徳 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-261527
公開番号(公開出願番号):特開平9-106295
出願日: 1995年10月09日
公開日(公表日): 1997年04月22日
要約:
【要約】【課題】 リジェクト用の探索処理(trellis やViterbi search )をなくし、さらにリジェクト用の探索空間(trellis 空間)を減らして、コンパクトで高速・高性能な音声認識を実現する音声認識方法およびその装置を提供する。【解決手段】 入力された音声を音響分析し音声パラメータを求め(202) 、各隠れマルコフモデルの各状態に対する出力確率を計算し(203) 、辞書や文法等の言語情報と隠れマルコフモデルとその状態の出力確率を用いて言語探索し、入力された音声の認識候補とその尤度を求める(205) と共に、各隠れマルコフモデルの各状態に対する出力確率を計算した結果より、分析された音声パラメータに対し最大の状態出力確率とその状態を求め(207) 、状態の遷移の仕方により決まる状態遷移確率により音声入力のリジェクト用の尤度を求め(208) 、前記2つの尤度の比に基づいて、閾値により音声入力の認識結果を出力するかリジェクトするかを決定する(209) 。
請求項(抜粋):
隠れマルコフモデルを用いて音声を認識する音声認識方法において、入力された音声の認識候補の尤度と前記入力された音声のリジェクト用の尤度とを求め、前記2つの尤度の比に基づいて、前記入力された音声の認識結果を出力するかリジェクトするかを決定することを特徴とする音声認識方法。
IPC (2件):
G10L 3/00 535 ,  G10L 3/00 561
FI (2件):
G10L 3/00 535 ,  G10L 3/00 561 B
引用特許:
審査官引用 (2件)
  • 音声認識装置
    公報種別:公開公報   出願番号:特願平7-213429   出願人:シャープ株式会社
  • 音声認識方法
    公報種別:公開公報   出願番号:特願平6-133339   出願人:日本電信電話株式会社

前のページに戻る