Pat
J-GLOBAL ID:200903064545215857

音声認識装置

Inventor:
Applicant, Patent owner:
Agent (1): 小鍜治 明 (外2名)
Gazette classification:公開公報
Application number (International application number):1994209699
Publication number (International publication number):1996076792
Application date: Sep. 02, 1994
Publication date: Mar. 22, 1996
Summary:
【要約】【目的】 発声変動や雑音に対して誤認識を起こしにくい音声認識装置の提供。【構成】 話者によって発声された音声を音声特徴ベクトル抽出部5によりFFTスペクトルなどの時系列に変換する。同時に該話者の口唇の動きをフォトトランジスタ3等の受光素子により受光電力などに変換し、口唇特徴ベクトル抽出部が受光電力の変動量の時系列等の口唇特徴ベクトルを出力する。次に累積変動関数抽出部7がその特徴ベクトルを累積し時間の関数として累積変動関数を出力する。時系列抽出部8は累積変動関数の累積変化を等分割する時刻列を求める。音声認識部9が該時刻列の各時刻を基準として音声認識を行うことにより上記目的が達成される。
Claim (excerpt):
話者によって発声された入力音声を電気信号に変換して出力する音声入力手段と、該話者の口唇の動きを電気信号に変換して出力する画像入力手段と、該音声入力手段が出力する電気信号を解析して音声の特徴ベクトルを抽出する音声特徴ベクトル抽出手段と、該画像入力手段が出力する電気信号を解析して口唇の動き特徴ベクトルを抽出し、単位時間毎の該特徴ベクトルの変動量を時系列として出力する口唇特徴ベクトル抽出手段と、該口唇特徴ベクトル時系列をを累積し時間の関数として累積変動関数を出力する累積変動関数抽出手段と、該累積変動関数の累積変化を等分割する時刻列を求める時刻列抽出手段と、該時刻列の各時刻を基準として音声認識を行う音声認識手段とを備えたことを特徴とする音声認識装置。
IPC (4):
G10L 3/00 571 ,  G10L 3/00 515 ,  G06F 17/14 ,  G06T 1/00
FI (2):
G06F 15/332 S ,  G06F 15/62 380
Patent cited by the Patent:
Cited by examiner (13)
  • 特開昭57-081300
  • 特公平1-015079
  • 特開平3-040177
Show all

Return to Previous Page