特許
J-GLOBAL ID:200903030411062858

連続音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平6-262248
公開番号(公開出願番号):特開平8-123479
出願日: 1994年10月26日
公開日(公表日): 1996年05月17日
要約:
【要約】【目的】 音素照合の処理時間を短縮して音声認識の計算量を削減することができ、しかも従来例に比較して音声認識率を改善することができる連続音声認識装置を提供する。【構成】 LRパーザは、音素履歴木と状態ネットワークとを格納するメモリを備え、文脈自由文法を参照してフレームに同期して動作する探索部から入力される検出音素に基づいて音素履歴木と状態ネットワークとを展開して作成し、状態ネットワークの各ノードにおける予測音素の和集合を音素履歴木の対応するノードにおけるメモリに格納するとともに、予測音素の和集合を探索部に出力し、探索部は、LRパーザからの予測音素の和集合に基づいてHMMを参照して、入力フレーム番号とHMMの状態番号と予測音素と音素履歴木のノードとからなるグリッド仮説を作成して音素履歴木の尤度を計算し所定の尤度を有する音素履歴木から得られる文字列を音声認識結果として出力する。
請求項(抜粋):
入力される発声音声文に基づいて、発声音声の所定の時間に対応するフレームに同期して動作し、所定の隠れマルコフモデルを参照して音素を検出してその尤度を計算する探索手段と、上記探索手段によって検出された音素に基づいて所定の文脈自由文法を参照して次の音素を予測して当該予測音素を上記探索手段に出力する統語解析手段とを備え、上記入力された発声音声文を連続的に音声認識する連続音声認識装置であって、上記統語解析手段は、音素履歴木と状態ネットワークとを格納する記憶手段を備え、上記文脈自由文法を参照して、上記探索手段から入力される検出音素に基づいて、上記音素履歴木と上記状態ネットワークとを展開して作成し、上記状態ネットワークの各ノードにおける予測音素の和集合を上記音素履歴木の対応するノードにおける上記記憶手段に格納するとともに、上記予測音素の和集合を上記探索手段に出力し、上記探索手段は、上記統語解析手段から出力された予測音素の和集合に基づいて、上記隠れマルコフモデルを参照して、入力フレーム番号と、隠れマルコフモデルの状態番号と、予測音素と、音素履歴木のノードとからなるグリッド仮説を作成して当該音素履歴木の尤度を計算し、所定の尤度を有する音素履歴木から得られる文字列を音声認識結果として出力することを特徴とする連続音声認識装置。
IPC (2件):
G10L 3/00 561 ,  G10L 3/00 535

前のページに戻る