特許
J-GLOBAL ID:200903092505913644

音声認識装置及び音声入力装置

発明者:
出願人/特許権者:
代理人 (1件): 小鍜治 明 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平6-099625
公開番号(公開出願番号):特開平7-306692
出願日: 1994年05月13日
公開日(公表日): 1995年11月21日
要約:
【要約】【目的】 口唇の情報を用いた、周囲騒音等のノイズによる影響を受けないで安定した認識を行うことのできる音声認識装置と、音声認識を用いないで自動的に音声信号の記録・再生の制御を行う音声入力装置を実現する。【構成】 発光素子の反射光を受光素子102で電気信号に変換して、顔の変化を捉え、微分処理部103による処理を経て、口唇の時間的変化を表す信号を抽出する。カテゴリ分類部704では、まず時系列パターン抽出部701が微分処理部103の信号からさらに特徴的な部分を取り出し、カテゴリ判断部703が標準パターン保持部702にある比較用標準パターンとの比較を行うことによって、口唇の大まかなカテゴリ分類を行う。音声認識部109は、カテゴリ判断部703で得られたカテゴリ内に属する音声のみを認識対象として認識を行う。
請求項(抜粋):
音声信号を入力する音声入力手段と、前記音声入力手段で得られた音声信号を用いて音声認識する音声認識手段と、口唇を含む画像を入力する画像入力手段と、前記画像入力手段を用いて入力された画像信号から口唇の情報を抽出する特徴抽出手段と、前記特徴抽出手段で得られた口唇の情報により前記音声認識手段の結果が有効であるか否かを判断する音声判断手段と、前記音声判断手段の結果と前記音声認識手段の結果から最終的な認識判断を行う認識判断手段とを備えたことを特徴とする音声認識装置。
IPC (7件):
G10L 3/00 571 ,  G10L 3/00 ,  G10L 3/00 521 ,  G06T 1/00 ,  G06T 7/20 ,  G10L 5/06 ,  G10L 9/10 301
FI (2件):
G06F 15/62 380 ,  G06F 15/70 410
引用特許:
審査官引用 (14件)
  • 会話認識システム
    公報種別:公開公報   出願番号:特願平5-103842   出願人:株式会社リコー
  • 特開昭60-188998
  • 音声入力方法及び装置
    公報種別:公開公報   出願番号:特願平4-169580   出願人:キヤノン株式会社
全件表示

前のページに戻る