Pat
J-GLOBAL ID:200903092505913644

音声認識装置及び音声入力装置

Inventor:
Applicant, Patent owner:
Agent (1): 小鍜治 明 (外2名)
Gazette classification:公開公報
Application number (International application number):1994099625
Publication number (International publication number):1995306692
Application date: May. 13, 1994
Publication date: Nov. 21, 1995
Summary:
【要約】【目的】 口唇の情報を用いた、周囲騒音等のノイズによる影響を受けないで安定した認識を行うことのできる音声認識装置と、音声認識を用いないで自動的に音声信号の記録・再生の制御を行う音声入力装置を実現する。【構成】 発光素子の反射光を受光素子102で電気信号に変換して、顔の変化を捉え、微分処理部103による処理を経て、口唇の時間的変化を表す信号を抽出する。カテゴリ分類部704では、まず時系列パターン抽出部701が微分処理部103の信号からさらに特徴的な部分を取り出し、カテゴリ判断部703が標準パターン保持部702にある比較用標準パターンとの比較を行うことによって、口唇の大まかなカテゴリ分類を行う。音声認識部109は、カテゴリ判断部703で得られたカテゴリ内に属する音声のみを認識対象として認識を行う。
Claim (excerpt):
音声信号を入力する音声入力手段と、前記音声入力手段で得られた音声信号を用いて音声認識する音声認識手段と、口唇を含む画像を入力する画像入力手段と、前記画像入力手段を用いて入力された画像信号から口唇の情報を抽出する特徴抽出手段と、前記特徴抽出手段で得られた口唇の情報により前記音声認識手段の結果が有効であるか否かを判断する音声判断手段と、前記音声判断手段の結果と前記音声認識手段の結果から最終的な認識判断を行う認識判断手段とを備えたことを特徴とする音声認識装置。
IPC (7):
G10L 3/00 571 ,  G10L 3/00 ,  G10L 3/00 521 ,  G06T 1/00 ,  G06T 7/20 ,  G10L 5/06 ,  G10L 9/10 301
FI (2):
G06F 15/62 380 ,  G06F 15/70 410
Patent cited by the Patent:
Cited by examiner (14)
  • 会話認識システム
    Gazette classification:公開公報   Application number:特願平5-103842   Applicant:株式会社リコー
  • 特開昭60-188998
  • 音声入力方法及び装置
    Gazette classification:公開公報   Application number:特願平4-169580   Applicant:キヤノン株式会社
Show all

Return to Previous Page