特許
J-GLOBAL ID:200903050389776427

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 岡本 宜喜
公報種別:公開公報
出願番号(国際出願番号):特願2000-164077
公開番号(公開出願番号):特開2001-083978
出願日: 2000年06月01日
公開日(公表日): 2001年03月30日
要約:
【要約】【課題】 入力音声は母音のように時間的に定常性が高い部分と、子音のように時間的な定常性が低い部分とがある。このような入力音声の特徴により分析窓長を可変にすることにより、認識処理時間を増加させることなく、従来より認識性能の高い音声認識装置を提供する。【解決手段】 入力された音声に対して、音声分析部103,104は各時刻毎に該音声から各々違った分析窓長で各々特徴ベクトルに変換する。特徴ベクトル間相関算出部105は各時刻の各々の特徴ベクトル間の相関値を算出する。特徴ベクトル間の相関値に応じて違った分析窓長で算出された特徴ベクトルの中から最適の特徴ベクトルを選択し、これを用いてHMM法により音声を認識する。
請求項(抜粋):
音声を入力するための音声入力手段と、各時刻毎に該入力音声を各々異なった分析窓長で特徴ベクトルに変換する少なくとも2つの音声分析手段と、前記各音声分析手段から出力される特徴ベクトル間の相関値及び類似度の少なくとも一方を算出する特徴ベクトル間相関算出手段と、前記特徴ベクトル間相関値算出手段で算出された相関値又は類似度に応じて前記音声分析手段で算出された特徴ベクトルの中から相関値又は類似度が大きい場合は入力音声の変化が少ないとして大きい分析窓長の特徴ベクトルを、相関値又は類似度が小さい場合は入力音声の変化が多いとして小さい分析窓長の特徴ベクトル(以降、選択特徴ベクトルと呼ぶ)を選択する特徴ベクトル選択手段と、各認識対象語彙に対するモデルを記憶する標準パタン記憶手段と、前記選択特徴ベクトルの時系列と前記標準パタン記憶手段に記憶されている標準パタンとの尤度を計算する認識手段と、前記認識手段の出力である各標準パタンとの尤度から認識結果を判定する認識結果判定手段とを備えたことを特徴とする音声認識装置。
IPC (2件):
G10L 11/00 ,  G10L 15/02
FI (2件):
G10L 3/00 515 A ,  G10L 3/00 515 E
Fターム (3件):
5D015CC05 ,  5D015FF05 ,  5D015HH23

前のページに戻る