Pat
J-GLOBAL ID:200903000212844220

ビデオ・イメ-ジ及びビデオ・デ-タの獲得装置及び方法

Inventor:
Applicant, Patent owner:
Agent (1): 坂口 博 (外1名)
Gazette classification:公開公報
Application number (International application number):1999246863
Publication number (International publication number):2000112496
Application date: Sep. 01, 1999
Publication date: Apr. 21, 2000
Summary:
【要約】【課題】 音声認識プロセスの間に音響データと共に使用される、口形状及び唇形状の側面プロファイルを獲得するための、比較的単純な装置及び方法を提供することである。【解決手段】 口元領域を横方向からイメージ形成し、口形状及び唇形状の確実な測定を生成することにより、音声認識タスクを支援する装置及び方法を提供する。ビデオ・カメラがヘッドセット及びマイクロフォンと共に構成され、話者の側面プロファイル・イメージを捕獲する。次に、側面プロファイル・イメージが、唇分離パラメータ、唇形状パラメータ、及び侵入の深さパラメータなどの特徴を計算するために使用される。パラメータは音声認識プロセスの間に、話された音素を特徴化及び区別するためにリアルタイムに使用され、特に雑音の多い環境において、自動音声認識処理における高度な精度を生成する。
Claim (excerpt):
音響音声認識システムと共に使用されるビデオ・イメージ及びビデオ・データを獲得する装置であって、音声を発声中に話者の口元領域の側面図を捕獲するために配置され、側面イメージを捕獲するビデオ・カメラと、1つ以上の捕獲した側面イメージから特徴を計算する第1の手段とを含み、計算された前記特徴を発声音声の音響信号と共に、自動音声認識のために使用する、装置。
IPC (5):
G10L 15/24 ,  G06T 7/00 ,  G09F 27/00 ,  G10L 15/06 ,  G10L 15/14
FI (5):
G10L 3/00 571 Q ,  G09F 27/00 N ,  G06F 15/70 460 B ,  G10L 3/00 521 F ,  G10L 3/00 535 Z

Return to Previous Page