特許
J-GLOBAL ID:200903097316101339

音声認識方法および装置

発明者:
出願人/特許権者:
代理人 (1件): 長谷川 文廣
公報種別:公開公報
出願番号(国際出願番号):特願2002-096318
公開番号(公開出願番号):特開2003-295887
出願日: 2002年03月29日
公開日(公表日): 2003年10月15日
要約:
【要約】【課題】 従来のHMMを用いた認識手法では不十分であった不特定話者の連続音声に対する認識精度について一層の改善を図ることである。【解決手段】 従来のDPマッチングやHMMで利用されていない長区間にまたがるフレーム間の相関情報を利用して、不特定話者の連続音声に対する認識率を向上させる。そのため、複数の状態を持つ隠れマルコフモデル(HMM)の音声認識モデルを用いて、その各状態ごとに対応する区間の入力音声フレームをフォースアライメントにより切り出し、切り出された各フレームに含まれる入力特徴パターンを平均化したものを上記状態数分繋ぎ合わせ、その結果得られたベクトルを、新たな認識パラメータとして認識を行なうものである。
請求項(抜粋):
複数の状態を持つ隠れマルコフモデル(HMM)の音声認識モデルを用いて、その各状態ごとに対応する区間の入力音声フレームをフォースアライメントにより切り出し、切り出された各フレームに含まれる入力特徴パターンを平均化したものを上記状態数分繋ぎ合わせ、その結果得られたベクトルを、新たな認識パラメータとして認識を行なうことを特徴とする音声認識方法。
IPC (2件):
G10L 15/14 ,  G10L 15/02
FI (2件):
G10L 3/00 535 A ,  G10L 3/00 515 Z
Fターム (5件):
5D015AA01 ,  5D015AA02 ,  5D015BB02 ,  5D015FF03 ,  5D015HH23
引用特許:
審査官引用 (1件)
  • 音声認識方法
    公報種別:公開公報   出願番号:特願平9-295111   出願人:松下電器産業株式会社
引用文献:
前のページに戻る