Pat
J-GLOBAL ID:200903070702743900

連続数字音声認識方法

Inventor:
Applicant, Patent owner:
Agent (1): 若林 忠
Gazette classification:公開公報
Application number (International application number):1995045681
Publication number (International publication number):1996241093
Application date: Mar. 06, 1995
Publication date: Sep. 17, 1996
Summary:
【要約】【目的】調音結合の影響を考慮した文脈依存モデルを、所要の学習データ量を抑えながら実現し、連続数字の認識において高い認識率が得られるようにする。【構成】数字音声の音響的特徴量を抽出してその音響的特徴量を統計的にモデル化して各数字に対応した音響モデルを構成する際に、各数字に対応する音響モデルを語頭部分モデル、語中部分モデル、語尾部分モデルの三つの部分音響モデルから構成する。このうち語頭部分モデルと語尾部分モデルは、前後に連続する数字の文脈に応じて、一つの数字に対して複数種類用意する。認識時には、文脈に応じた部分音響モデルを連結し、入力音声との一致の度合から入力音声に対応する文字を探索する。
Claim (excerpt):
数字音声の音響的特徴量を抽出してその音響的特徴量を統計的にモデル化して各数字に対応した音響モデルを構成し、認識時には音響モデルと入力音声との一致の度合から入力音声に対応する数字を探索する数字音声認識方法において、各数字に対応する音響モデルを語頭部分モデル、語中部分モデル、語尾部分モデルの三つの部分音響モデルから構成し、語頭部分モデル、語尾部分モデルは前後に連続する数字の文脈に応じて一つの数字に対して1ないし複数種類用意し、認識時には文脈に応じた部分音響モデルを連結して音声認識を行なうことを特徴とする連続数字音声認識方法。
IPC (3):
G10L 3/00 521 ,  G10L 3/00 535 ,  G10L 3/00 561
FI (3):
G10L 3/00 521 F ,  G10L 3/00 535 ,  G10L 3/00 561 G

Return to Previous Page