特許
J-GLOBAL ID:200903010818174765

音声認識方法及び音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 岡本 宜喜
公報種別:公開公報
出願番号(国際出願番号):特願平8-307957
公開番号(公開出願番号):特開平10-149190
出願日: 1996年11月19日
公開日(公表日): 1998年06月02日
要約:
【要約】【課題】 音声認識装置において、認識性能を落とすことなく処理量を削減すること。【解決手段】 音声分析手段101は入力音声からフレーム毎に求めた特徴量の時系列を抽出する。学習音声分析手段102はあらかじめ用意した多量の学習用音声データを用いて認識対象語彙毎のフレーム毎に求めた特徴量の時系列を抽出する。モデル作成手段103は学習用音声データから求めた特徴量の時系列を用いて認識対象語彙毎の標準モデルを作成し、標準モデルを構成する情報を情報の重要度に応じて複数の階層に分離して保持しておく。類似度算出手段104は一部の階層の情報を用いて入力音声の特徴量の時系列との類似度を求める。最終判定手段105は得られた類似度を用いて入力音声がどの語彙に最も似ていたかを判定する。
請求項(抜粋):
入力音声から特徴量の時系列を抽出し、学習音声データから認識対象語彙の標準モデルを作成し、前記標準モデルの一部分の構成要素のみを利用して前記入力音声の特徴量の時系列との類似度を求め、前記入力音声がどの認識対象語彙に類似しているかを求めることを特徴とする音声認識方法。
IPC (3件):
G10L 3/00 531 ,  G10L 3/00 535 ,  G10L 9/16 301
FI (3件):
G10L 3/00 531 G ,  G10L 3/00 535 ,  G10L 9/16 301 B

前のページに戻る