特許
J-GLOBAL ID:200903002581489739

音声/画像を用いて話者を感知し位置探しする方法及び装置

発明者:
出願人/特許権者:
代理人 (3件): 伊東 忠彦 ,  大貫 進介 ,  伊東 忠重
公報種別:公表公報
出願番号(国際出願番号):特願2002-577570
公開番号(公開出願番号):特表2004-528766
出願日: 2002年03月15日
公開日(公表日): 2004年09月16日
要約:
本発明は、可動なパン・チルト・ズーム(“PTZ”)カメラの効果を提供するために話者を自動的に位置探しし、ビデオ画像を電子的に処理する2つのマイクロホンよりなるアレイと固定のカメラとを有するビデオ会議システムのための方法及び装置に関わる。コンピュータビジョンアルゴリズムは、広角の固定のカメラの視野にいる人を感知し、位置探しし、追跡するために用いられる。2つの水平方向に離間されたマイクロホンよりなるマイクロホンアレイから得られる推定された音響遅延は、話している人を選択するために使用される。本システムは、全ての可能な不正確さを感知することができ、この場合、安全側に作動するよう応答し、例えば、同じ水平位置に位置する全ての話者を含むようズームアウトし得る。
請求項(抜粋):
画像を表わす画像信号を生成する画像捕捉装置と、 音声源からの音を表わす音声信号を生成する音声捕捉装置と、 上記画像信号及び上記音声信号を処理し、基準点に対する上記音声源の方向を決定するマルチモード統合アーキテクチャシステムと、を有するビデオ会議システム。
IPC (2件):
H04N5/232 ,  H04N7/15
FI (2件):
H04N5/232 C ,  H04N7/15 630A
Fターム (14件):
5C064AA02 ,  5C064AB04 ,  5C064AC02 ,  5C064AC06 ,  5C064AC09 ,  5C064AC13 ,  5C122DA08 ,  5C122EA54 ,  5C122EA66 ,  5C122FA02 ,  5C122FE03 ,  5C122FE05 ,  5C122FJ01 ,  5C122FJ09

前のページに戻る