特許
J-GLOBAL ID:200903068637980709

連続音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-330679
公開番号(公開出願番号):特開平10-171490
出願日: 1996年12月11日
公開日(公表日): 1998年06月26日
要約:
【要約】【課題】 従来例に比較して処理時間を短縮することができるとともに、認識率を改善することができる連続音声認識装置を提供することにある。【解決手段】 音素照合部4は入力される自由発話の発声音声文の音声信号に基づいてHMMを参照して音素認識し、GLRパーザ5はCFGルールに基づいて生成された第1のLR構文解析テーブルと、語彙規則に基づいて生成された第2のLR構文解析テーブルと、CFGルールに基づいて生成された、当該ルールで書き換えたときの末端の要素を示す終端記号の1つ手前の記号である前終端記号のバイグラムを含む統計的言語モデルとを参照して構文解析して上記発声音声文を音声認識する。GLRパーザ5はHMMに基づいた音響スコアと第1と第2のLR構文解析テーブルと統計的言語モデルとに基づいた言語スコアとに基づいて音声認識のための尤度スコアを計算ししきい値を用いてビーム探索により音声認識結果を決定する。
請求項(抜粋):
入力される自由発話の発声音声文の音声信号に基づいて音声認識する音声認識手段を備えた連続音声認識装置において、上記音声認識手段は、上記音声信号に基づいて所定の隠れマルコフモデルを参照して音素認識し、かつ、所定の文脈自由文法規則に基づいて生成された第1のLR構文解析テーブルと、所定の語彙規則に基づいて生成された第2のLR構文解析テーブルと、上記文脈自由文法規則に基づいて生成された、上記文脈自由文法規則で書き換えたときの末端の要素を示す終端記号の1つ手前の記号である前終端記号のバイグラムを含む統計的言語モデルとを参照して構文解析することにより、上記発声音声文を音声認識することを特徴とする連続音声認識装置。
IPC (2件):
G10L 3/00 535 ,  G10L 3/00 561
FI (2件):
G10L 3/00 535 ,  G10L 3/00 561 G

前のページに戻る