特許
J-GLOBAL ID:200903038985585469
話し手位置検出装置及びその方法
発明者:
,
,
,
,
出願人/特許権者:
代理人 (1件):
磯野 道造
公報種別:公開公報
出願番号(国際出願番号):特願2000-248307
公開番号(公開出願番号):特開2001-175869
出願日: 2000年08月18日
公開日(公表日): 2001年06月29日
要約:
【要約】【課題】 映像で話し手の目と顔の位置をより正確かつより迅速に探すことができ、しかも映像雑音にも強い話し手位置検出装置及びその方法を提供する。【解決手段】 映像で、相対的に強い灰色特徴を示すピクセルを検出し、このピクセルが形成する領域中から部分凝集特性を示しかつテクスチャ特徴を有する領域を目の候補領域とする目位置検出手段10と、前記目の候補領域中から抽出した位置にマッチングさせて形成した探索テンプレートから最適の探索テンプレートを決定する顔位置決定手段20と、この最適の探索テンプレートを利用して話し手の位置領域を決定する抽出位置安定化手段30とを含む。
請求項(抜粋):
入力されたRGB映像で、相対的に強い灰色の特徴を示すピクセルを検出し、この検出されたピクセルが形成する領域の中から部分凝集特性を示してテクスチャ特徴を有する領域を目の候補領域として決定する目位置検出手段と、前記目の候補領域の中から抽出した2個の領域の位置にマッチングさせて探索テンプレートを形成し、RGB映像で前記探索テンプレートの領域内におけるピクセルの色度値に対する確率距離の和を正規化した値と、前記探索テンプレートによって推定される目、口及び鼻の位置における水平エッジの大きさとを用いて形成された探索テンプレート中、最適の探索テンプレートを決定する顔位置決定手段と、前記最適の探索テンプレートを利用して最小外廓四角形を構成し、形状メモリに記憶された各ピクセルに対してカウント値の中から前記最小外廓四角形の領域に対応するカウント値については増加させ、前記最小外廓四角形以外の領域は対応するカウント値については減少させることによって、前記形状メモリで所定の値以上のカウント値が位置した領域を話し手位置領域として出力する抽出位置安定化手段と、を含むことを特徴とする話し手位置検出装置。
IPC (4件):
G06T 7/00 300
, G06T 1/00 340
, G06T 7/60 200
, H04N 9/64
FI (4件):
G06T 7/00 300 D
, G06T 1/00 340 A
, G06T 7/60 200 Z
, H04N 9/64 J
Fターム (38件):
5B057BA02
, 5B057CA01
, 5B057CB01
, 5B057CE06
, 5B057CE18
, 5B057DA08
, 5B057DB06
, 5B057DC09
, 5B057DC16
, 5B057DC25
, 5B057DC32
, 5C066AA11
, 5C066BA20
, 5C066CA21
, 5C066EB03
, 5C066EE02
, 5C066EF11
, 5C066GA01
, 5C066GA02
, 5C066KC08
, 5C066KC09
, 5C066KD06
, 5C066KD07
, 5C066KE04
, 5C066KE07
, 5C066KE24
, 5L096AA02
, 5L096BA18
, 5L096CA04
, 5L096EA45
, 5L096FA06
, 5L096FA15
, 5L096FA18
, 5L096FA32
, 5L096FA33
, 5L096FA69
, 5L096GA55
, 5L096JA09
前のページに戻る