特許
J-GLOBAL ID:200903000075967379

音声認識装置及び音声認識方法

発明者:
出願人/特許権者:
代理人 (1件): 柏木 明 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-204215
公開番号(公開出願番号):特開平9-050288
出願日: 1995年08月10日
公開日(公表日): 1997年02月18日
要約:
【要約】【課題】 ワードスポッティングによる音声認識を高速化する。【解決手段】 音声入力手段2に連続的に入力される音声信号を、特徴抽出手段3により音声パターンに変換する。この音声パターンから、認識音声が含まれることが予想される有音区間を有音検出手段4により検出し、この有音区間でワードスポッティングによる音声認識を音声認識手段5により実行する。音声信号が連続でもワードスポッティングは有音区間でのみ実行されるので、処理負担が軽減されて認識処理が高速化される。
請求項(抜粋):
音声信号が連続的に入力される音声入力手段と、連続的な音声信号を特徴ベクトルの時系列である音声パターンに変換する特徴抽出手段と、認識する音声が含まれることが予想される有音区間を音声パターンから所定条件に従って検出する有音検出手段と、有音区間でワードスポッティングによる音声認識を実行する音声認識手段と、を有することを特徴とする音声認識装置。
IPC (2件):
G10L 3/00 531 ,  G10L 3/00 513
FI (2件):
G10L 3/00 531 C ,  G10L 3/00 513 A
引用特許:
審査官引用 (6件)
  • 特開昭63-223798
  • 音声認識方法
    公報種別:公開公報   出願番号:特願平4-326671   出願人:日本電信電話株式会社
  • ワードスポッティング音声認識装置
    公報種別:公開公報   出願番号:特願平5-027767   出願人:日本電信電話株式会社
全件表示

前のページに戻る