特許
J-GLOBAL ID:200903070702743900

連続数字音声認識方法

発明者:
出願人/特許権者:
代理人 (1件): 若林 忠
公報種別:公開公報
出願番号(国際出願番号):特願平7-045681
公開番号(公開出願番号):特開平8-241093
出願日: 1995年03月06日
公開日(公表日): 1996年09月17日
要約:
【要約】【目的】調音結合の影響を考慮した文脈依存モデルを、所要の学習データ量を抑えながら実現し、連続数字の認識において高い認識率が得られるようにする。【構成】数字音声の音響的特徴量を抽出してその音響的特徴量を統計的にモデル化して各数字に対応した音響モデルを構成する際に、各数字に対応する音響モデルを語頭部分モデル、語中部分モデル、語尾部分モデルの三つの部分音響モデルから構成する。このうち語頭部分モデルと語尾部分モデルは、前後に連続する数字の文脈に応じて、一つの数字に対して複数種類用意する。認識時には、文脈に応じた部分音響モデルを連結し、入力音声との一致の度合から入力音声に対応する文字を探索する。
請求項(抜粋):
数字音声の音響的特徴量を抽出してその音響的特徴量を統計的にモデル化して各数字に対応した音響モデルを構成し、認識時には音響モデルと入力音声との一致の度合から入力音声に対応する数字を探索する数字音声認識方法において、各数字に対応する音響モデルを語頭部分モデル、語中部分モデル、語尾部分モデルの三つの部分音響モデルから構成し、語頭部分モデル、語尾部分モデルは前後に連続する数字の文脈に応じて一つの数字に対して1ないし複数種類用意し、認識時には文脈に応じた部分音響モデルを連結して音声認識を行なうことを特徴とする連続数字音声認識方法。
IPC (3件):
G10L 3/00 521 ,  G10L 3/00 535 ,  G10L 3/00 561
FI (3件):
G10L 3/00 521 F ,  G10L 3/00 535 ,  G10L 3/00 561 G

前のページに戻る