特許
J-GLOBAL ID:200903019998522054

音声認識システムの言語モデルのサイズを適応させるための方法および装置

発明者:
出願人/特許権者:
代理人 (1件): 坂口 博 (外1名)
公報種別:公表公報
出願番号(国際出願番号):特願平9-517770
公開番号(公開出願番号):特表平10-501078
出願日: 1995年11月04日
公開日(公表日): 1998年01月27日
要約:
【要約】音声認識システムにおいて、単語nグラムを含む言語モデルのサイズを適合、具体的には縮小するための、方法および装置を開示する。本発明は、システムの音響部分が、正しく認識するために言語モデルからの支援をさほど必要としないnグラムを破棄する機構を提供する。提案される方法は、システムの作成中に破棄の目的で言語モデル内のトライグラムを識別するのに適する。また、精度を維持しながら言語モデルの圧縮を可能にする、もう1つの単語自動分類方式も提供する。さらに、この方法によれば、役に立つ時にはシングルトン・トライグラムであっても使用されるので、数少ない使用可能なテキスト・コーパスの効率的な使用が可能になる。主要なツールである高速突合せスコアリングは、既知の認識機構自体で簡単に使用可能なモジュールであるから、追加のソフトウェア・ツールを開発する必要はない。音響的に単語が互いに区別される限り、単語が発生する共通テキストに従う単語の分類によって、この方法はさらに改善される。本発明によって、低コスト・パーソナル・コンピュータ(PC)でも、ラップトップなどの可搬型コンピュータであっても、音声認識を使用可能にする可能性が開かれる。
請求項(抜粋):
・音響音声信号を分析し、それぞれの単語候補を供給するための第1認識手段と、 ・単語候補のそれぞれについて、その単語がすでに認識された単語に続く可能性の、言語モデルに基づく確率を判定するための第2認識手段と を含む音声認識装置または音声認識システムにおいて、 ・言語モデルに含まれる単語の音響距離値を判定するステップと、 ・音響距離値の閾値を定義するステップと、 ・言語モデル内で、音響距離が閾値を超える単語を識別するステップと、 ・言語モデル内のこれらの単語を破棄するステップと を特徴とする、言語モデルのサイズを変更するための方法。
IPC (2件):
G10L 3/00 561 ,  G10L 3/00 521
FI (2件):
G10L 3/00 561 G ,  G10L 3/00 521 C

前のページに戻る