特許
J-GLOBAL ID:200903014060352093

音声認識方法

発明者:
出願人/特許権者:
代理人 (1件): 志賀 正武
公報種別:公開公報
出願番号(国際出願番号):特願平9-059397
公開番号(公開出願番号):特開平10-254480
出願日: 1997年03月13日
公開日(公表日): 1998年09月25日
要約:
【要約】【課題】高精度な言語モデルを用いて、高性能な連続音声認識処理を高速に行う音声認識方法を提供する。【解決手段】入力音声の音響的な特徴からその認識結果を判定する音響モデルと、文法的な特徴から認識結果を判定する言語モデルとを用いて、複数段階の判定・探索により認識結果を得る連続音声認識方法であって、1段階目の探索で簡単な音響モデルと簡単な言語モデルを用いて入力音声に対して高い評価値を与える認識結果の上位N個の仮説を出力し(ステップS110)、2段階目以降の探索を行う際に、1段階目の探索で絞り込んだ候補群の再評価に必要な高度な言語モデルをあらかじめ抽出し(ステップS140)、2段階目以降の探索で高度な音響モデルおよび高度な言語モデルを用いて1段階目の候補を再評価し、評価値の高い候補を認識結果とする(ステップS150)。
請求項(抜粋):
入力音声の音響的な特徴からその認識結果を判定する音響モデルと、文法的な特徴から認識結果を判定する言語モデルとを用いて、複数段階の判定・探索により認識結果を得る連続音声認識方法であって、1段階目の探索で簡単な音響モデルと簡単な言語モデルを用いて入力音声に対して高い評価値を与える認識結果の複数の候補を出力し、2段階目以降の探索で高度な音響モデルおよび高度な言語モデルを用いて1段階目の候補を再評価し評価値の高い候補を認識結果とする音声認識処理において、2段階目以降の探索を行う際に1段階目の探索で絞り込んだ候補群の評価に必要な高度な言語モデルをあらかじめ抽出しておくことを特徴とする音声認識方法。
IPC (2件):
G10L 3/00 531 ,  G10L 5/06
FI (2件):
G10L 3/00 531 D ,  G10L 5/06 D

前のページに戻る