Pat
J-GLOBAL ID:200903042166917492

音声認識装置

Inventor:
Applicant, Patent owner:
Agent (1): 志賀 正武 (外2名)
Gazette classification:公開公報
Application number (International application number):1991337280
Publication number (International publication number):1993188993
Application date: Dec. 19, 1991
Publication date: Jul. 30, 1993
Summary:
【要約】【目的】 音声認識率の向上を達成する。【構成】 CCDカメラ23はマイク22の音声入力者の口元付近の画像データを画像処理手段25へ出力する。画像処理手段25は画像データの特徴を抽出し、該データを画像認識手段26へ出力し、音声処理開始指令を音声処理手段27へ出力する。画像認識手段26は画像処理手段25からの画像特徴データに基づき画像認識を行い、画像認識結果を制御手段28へ出力する。音声処理手段27は画像処理手段25からの音声処理開始指令に基づき、入力音声データの特徴を抽出し、音声特徴データを音声認識手段29へ出力する。音声認識手段29は音声処理手段27からの音声特徴データと制御手段28からの画像認識結果とに基づき音声認識を行う。
Claim (excerpt):
話者が発する音声を認識する音声認識装置において、音声を入力する音声入力手段と、前記音声入力手段へ音声入力する話者の画像を撮像する画像入力手段と、前記画像入力手段から出力される画像データの特徴を抽出し、画像特徴データと音声処理開始指令を出力する画像処理手段と、前記画像処理手段から出力される画像特徴データに基づき、画像認識を行い画像認識結果を出力する画像認識手段と、前記画像処理手段から出力される音声処理開始指令に基づき、前記音声入力手段から音声データを取込み、音声データの特徴を抽出する音声処理手段と、前記音声処理手段から出力される音声特徴データと前記画像認識手段から出力される画像認識結果とに基づき、音声認識を行う音声認識手段と、前記音声認識手段による音声認識結果を出力する制御手段と、を具備することを特徴とする音声認識装置。
IPC (2):
G10L 3/00 571 ,  G10L 3/00 551
Patent cited by the Patent:
Cited by examiner (9)
  • 特開昭59-147398
  • 特開昭60-188998
  • 特開昭56-126160
Show all

Return to Previous Page