特許
J-GLOBAL ID:200903064545215857

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 小鍜治 明 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平6-209699
公開番号(公開出願番号):特開平8-076792
出願日: 1994年09月02日
公開日(公表日): 1996年03月22日
要約:
【要約】【目的】 発声変動や雑音に対して誤認識を起こしにくい音声認識装置の提供。【構成】 話者によって発声された音声を音声特徴ベクトル抽出部5によりFFTスペクトルなどの時系列に変換する。同時に該話者の口唇の動きをフォトトランジスタ3等の受光素子により受光電力などに変換し、口唇特徴ベクトル抽出部が受光電力の変動量の時系列等の口唇特徴ベクトルを出力する。次に累積変動関数抽出部7がその特徴ベクトルを累積し時間の関数として累積変動関数を出力する。時系列抽出部8は累積変動関数の累積変化を等分割する時刻列を求める。音声認識部9が該時刻列の各時刻を基準として音声認識を行うことにより上記目的が達成される。
請求項(抜粋):
話者によって発声された入力音声を電気信号に変換して出力する音声入力手段と、該話者の口唇の動きを電気信号に変換して出力する画像入力手段と、該音声入力手段が出力する電気信号を解析して音声の特徴ベクトルを抽出する音声特徴ベクトル抽出手段と、該画像入力手段が出力する電気信号を解析して口唇の動き特徴ベクトルを抽出し、単位時間毎の該特徴ベクトルの変動量を時系列として出力する口唇特徴ベクトル抽出手段と、該口唇特徴ベクトル時系列をを累積し時間の関数として累積変動関数を出力する累積変動関数抽出手段と、該累積変動関数の累積変化を等分割する時刻列を求める時刻列抽出手段と、該時刻列の各時刻を基準として音声認識を行う音声認識手段とを備えたことを特徴とする音声認識装置。
IPC (4件):
G10L 3/00 571 ,  G10L 3/00 515 ,  G06F 17/14 ,  G06T 1/00
FI (2件):
G06F 15/332 S ,  G06F 15/62 380
引用特許:
審査官引用 (13件)
  • 特開昭57-081300
  • 特公平1-015079
  • 特開平3-040177
全件表示

前のページに戻る