特許
J-GLOBAL ID:200903018454327570
音声認識装置
発明者:
,
出願人/特許権者:
代理人 (1件):
澤田 俊夫
公報種別:公開公報
出願番号(国際出願番号):特願平10-227938
公開番号(公開出願番号):特開2000-056793
出願日: 1998年08月12日
公開日(公表日): 2000年02月25日
要約:
【要約】【課題】 探索空間を小さくして高速の音声認識を行なうとともに、誤認識を検出して必要な部分だけ高精度な認識も行なえるようにする。【解決手段】 音響分析部11は、入力された音声を、シンボル系列に変換する。音韻照合・グラフ作成部12は、入力シンボルをHMMに照合し、音韻列の候補のモーラグラフを生成する。モーラグラフには音響的評価スコアも記述されている。探索部14は、小規模辞書・小規模言語モデルを参照して、モーラグラフを探索して尤度の高いモーラ列を決定する。誤認識判定部16は、音響的な尤度に着目して誤認識の可能性のある範囲を決定する。再探索部17は、誤認識が含まれている可能性が高いと判定された経路を大規模辞書・大規模言語モデルを用いて再探索する。
請求項(抜粋):
入力された音声に対して、音韻認識の結果得られる音韻列の候補集合をグラフで保持し、そのグラフを言語的な知識を用いて探索して音声認識結果を出力する音声認識装置において、第1の辞書と第1の言語モデルとを用いてグラフを探索して認識結果を決定する探索手段と、上記探索手段が決定した認識結果に対応するグラフ上の経路に関して、上記経路上のあるノードに注目したとき、上記認識結果の経路よりも音響的に尤度が高い、上記グラフ上の他の経路が上記注目しているノードに流入している場合、上記ノードを合流ノードとし、音響的な尤度が高い上記他の経路を上記グラフ上で上記合流ノードから溯ったときに上記他の経路が上記認識結果の経路と合流する分岐ノードを求め、上記分岐ノードから上記合流ノードまでの上記認識結果の経路上には誤認識が含まれている可能性が高いと判定する誤認識判定手段と、上記誤認識判定手段によって上記認識結果の経路上で誤認識の可能性が高い区間があると判定された場合、上記区間に対する、上記認識結果経路よりも音響的に尤度が高い上記他の経路を認識結果の経路に加えて再探索範囲を決定する再探索範囲決定手段と、上記再探索範囲決定手段によって決定された再探索範囲を、上記第1の辞書より大規模な第2の辞書と上記第1の言語モデルより大規模な第2の言語モデルとを用いて再探索し、最終的な認識結果を決定する再探索手段とを備えたことを特徴とする音声認識装置。
IPC (3件):
G10L 15/20
, G10L 15/10
, G10L 15/14
FI (3件):
G10L 3/00 531 P
, G10L 3/00 531 D
, G10L 3/00 535
Fターム (5件):
5D015AA05
, 5D015HH16
, 5D015HH23
, 5D015LL01
, 5D015LL04
前のページに戻る