特許
J-GLOBAL ID:200903042166917492

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 志賀 正武 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平3-337280
公開番号(公開出願番号):特開平5-188993
出願日: 1991年12月19日
公開日(公表日): 1993年07月30日
要約:
【要約】【目的】 音声認識率の向上を達成する。【構成】 CCDカメラ23はマイク22の音声入力者の口元付近の画像データを画像処理手段25へ出力する。画像処理手段25は画像データの特徴を抽出し、該データを画像認識手段26へ出力し、音声処理開始指令を音声処理手段27へ出力する。画像認識手段26は画像処理手段25からの画像特徴データに基づき画像認識を行い、画像認識結果を制御手段28へ出力する。音声処理手段27は画像処理手段25からの音声処理開始指令に基づき、入力音声データの特徴を抽出し、音声特徴データを音声認識手段29へ出力する。音声認識手段29は音声処理手段27からの音声特徴データと制御手段28からの画像認識結果とに基づき音声認識を行う。
請求項(抜粋):
話者が発する音声を認識する音声認識装置において、音声を入力する音声入力手段と、前記音声入力手段へ音声入力する話者の画像を撮像する画像入力手段と、前記画像入力手段から出力される画像データの特徴を抽出し、画像特徴データと音声処理開始指令を出力する画像処理手段と、前記画像処理手段から出力される画像特徴データに基づき、画像認識を行い画像認識結果を出力する画像認識手段と、前記画像処理手段から出力される音声処理開始指令に基づき、前記音声入力手段から音声データを取込み、音声データの特徴を抽出する音声処理手段と、前記音声処理手段から出力される音声特徴データと前記画像認識手段から出力される画像認識結果とに基づき、音声認識を行う音声認識手段と、前記音声認識手段による音声認識結果を出力する制御手段と、を具備することを特徴とする音声認識装置。
IPC (2件):
G10L 3/00 571 ,  G10L 3/00 551
引用特許:
審査官引用 (9件)
  • 特開昭59-147398
  • 特開昭60-188998
  • 特開昭56-126160
全件表示

前のページに戻る