特許
J-GLOBAL ID:200903029364230250

音声認識方法および音声認識プログラムを格納した記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 志賀 正武
公報種別:公開公報
出願番号(国際出願番号):特願平10-115736
公開番号(公開出願番号):特開平11-305789
出願日: 1998年04月24日
公開日(公表日): 1999年11月05日
要約:
【要約】【課題】モデルの学習時と入力音声の認識時の音声分析のための分析窓のシフト幅を変更し,高速処理が実行可能な音声認識方法を提供する.【解決手段】 速度係数が速度係数入力ステップ77から入力される.HMMメモリ78からHMM作成時の分析条件が読み出される.分析条件のうち,分析窓シフト幅に速度係数を掛け合わせ,認識時の分析窓シフト幅が分析窓シフト幅決定ステップ72で決定される.音声入力ステップ71から入力された認識対象音声信号は,決定された条件に従って特微量計算ステップ73において分析される.特徴量のうち,動的特微量はHMM作成時の分析条件と整合がとれるように動的特微量補正ステップ74で補正される.特微量とHMMを用いて尤度計算を尤度計算ステップ75において行い,最も尤度が大きかったHMMカテゴリを認識結果として認識結果決定ステップ76から出力する.
請求項(抜粋):
音声を入力するステップと音声信号をスペクトル特微量系列に変換するステップと,予め音声単位ごとに用意した隠れマルコフモデルと前記スペクトル特微量系列とを用いて音声を認識するステップを有する音声認識方法において,スペクトル特微量を計算する分析窓の時間間隔が,隠れマルコフモデルを学習する際のスペクトル分析における設定値と,隠れマルコフモデルを用いて認識処理を行う際のスペクトル分析における設定値とで異なる場合に,認識処理中に得られたスペクトルの動的特微量を補正し,学習済みの隠れマルコフモデルが持つスペクトルの動的特微量と整合をとった後に尤度計算をすること特徴とする音声認識方法.
IPC (2件):
G10L 3/00 535 ,  G10L 3/00 531
FI (2件):
G10L 3/00 535 ,  G10L 3/00 531 E
引用特許:
審査官引用 (2件)
  • 特開平1-106096
  • 特開昭60-091400

前のページに戻る