Pat
J-GLOBAL ID:200903029364230250
音声認識方法および音声認識プログラムを格納した記録媒体
Inventor:
Applicant, Patent owner:
Agent (1):
志賀 正武
Gazette classification:公開公報
Application number (International application number):1998115736
Publication number (International publication number):1999305789
Application date: Apr. 24, 1998
Publication date: Nov. 05, 1999
Summary:
【要約】【課題】モデルの学習時と入力音声の認識時の音声分析のための分析窓のシフト幅を変更し,高速処理が実行可能な音声認識方法を提供する.【解決手段】 速度係数が速度係数入力ステップ77から入力される.HMMメモリ78からHMM作成時の分析条件が読み出される.分析条件のうち,分析窓シフト幅に速度係数を掛け合わせ,認識時の分析窓シフト幅が分析窓シフト幅決定ステップ72で決定される.音声入力ステップ71から入力された認識対象音声信号は,決定された条件に従って特微量計算ステップ73において分析される.特徴量のうち,動的特微量はHMM作成時の分析条件と整合がとれるように動的特微量補正ステップ74で補正される.特微量とHMMを用いて尤度計算を尤度計算ステップ75において行い,最も尤度が大きかったHMMカテゴリを認識結果として認識結果決定ステップ76から出力する.
Claim (excerpt):
音声を入力するステップと音声信号をスペクトル特微量系列に変換するステップと,予め音声単位ごとに用意した隠れマルコフモデルと前記スペクトル特微量系列とを用いて音声を認識するステップを有する音声認識方法において,スペクトル特微量を計算する分析窓の時間間隔が,隠れマルコフモデルを学習する際のスペクトル分析における設定値と,隠れマルコフモデルを用いて認識処理を行う際のスペクトル分析における設定値とで異なる場合に,認識処理中に得られたスペクトルの動的特微量を補正し,学習済みの隠れマルコフモデルが持つスペクトルの動的特微量と整合をとった後に尤度計算をすること特徴とする音声認識方法.
IPC (2):
G10L 3/00 535
, G10L 3/00 531
FI (2):
G10L 3/00 535
, G10L 3/00 531 E
Patent cited by the Patent:
Return to Previous Page