特許
J-GLOBAL ID:200903000212844220

ビデオ・イメ-ジ及びビデオ・デ-タの獲得装置及び方法

発明者:
出願人/特許権者:
代理人 (1件): 坂口 博 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-246863
公開番号(公開出願番号):特開2000-112496
出願日: 1999年09月01日
公開日(公表日): 2000年04月21日
要約:
【要約】【課題】 音声認識プロセスの間に音響データと共に使用される、口形状及び唇形状の側面プロファイルを獲得するための、比較的単純な装置及び方法を提供することである。【解決手段】 口元領域を横方向からイメージ形成し、口形状及び唇形状の確実な測定を生成することにより、音声認識タスクを支援する装置及び方法を提供する。ビデオ・カメラがヘッドセット及びマイクロフォンと共に構成され、話者の側面プロファイル・イメージを捕獲する。次に、側面プロファイル・イメージが、唇分離パラメータ、唇形状パラメータ、及び侵入の深さパラメータなどの特徴を計算するために使用される。パラメータは音声認識プロセスの間に、話された音素を特徴化及び区別するためにリアルタイムに使用され、特に雑音の多い環境において、自動音声認識処理における高度な精度を生成する。
請求項(抜粋):
音響音声認識システムと共に使用されるビデオ・イメージ及びビデオ・データを獲得する装置であって、音声を発声中に話者の口元領域の側面図を捕獲するために配置され、側面イメージを捕獲するビデオ・カメラと、1つ以上の捕獲した側面イメージから特徴を計算する第1の手段とを含み、計算された前記特徴を発声音声の音響信号と共に、自動音声認識のために使用する、装置。
IPC (5件):
G10L 15/24 ,  G06T 7/00 ,  G09F 27/00 ,  G10L 15/06 ,  G10L 15/14
FI (5件):
G10L 3/00 571 Q ,  G09F 27/00 N ,  G06F 15/70 460 B ,  G10L 3/00 521 F ,  G10L 3/00 535 Z

前のページに戻る