特許
J-GLOBAL ID:200903095050292742

テレビ会議及び他の適用においてイベントを予測する方法及び装置

発明者:
出願人/特許権者:
代理人 (3件): 伊東 忠彦 ,  大貫 進介 ,  伊東 忠重
公報種別:公表公報
出願番号(国際出願番号):特願2002-548983
公開番号(公開出願番号):特表2004-515982
出願日: 2001年12月03日
公開日(公表日): 2004年05月27日
要約:
聴覚的及び視覚的なキューによりイベントを予測する方法及び装置である。例えばテレビ会議の参加者が自分が話す前に示す挙動といったイベントに一般的に関連付けられる1以上の(i)抑揚パターン、声の高さ、強さ等の聴覚的キュー、(ii)目線、顔のポーズ、体の姿勢、手振り、顔の表情等の視覚的キュー、又は、(iii)上述のキューの組合せを識別するためにオーディオ及びビデオ情報を処理する。このように本発明によればビデオ処理システムが次の話者のアイデンティティ等のイベントを予測しうる。予測話者識別部は学習モードで1以上の所定の視覚的又は聴覚的キューが存在する又は存在しないときに参加者が「これから話すであろう」又は「これから話さないであろう」という概念に関して各参加者の特徴プロファイルを学習するよう動作し、予測モードで特徴プロファイル中の学習された特徴をオーディオ及びビデオ情報と比較し次の話者を予測するよう動作する。
請求項(抜粋):
オーディオ及びビデオ情報のうちの少なくとも1つを用いてイベントを予測する方法であって、 決められたイベントであることを示唆する挙動特徴を定義する複数のキューを確立する段階と、 上記キューのうちの1つを同定するために上記オーディオ及びビデオ情報のうちの少なくとも1つを処理する段階とを含む方法。
IPC (1件):
H04N7/15
FI (1件):
H04N7/15 640A
Fターム (6件):
5C064AA02 ,  5C064AB04 ,  5C064AC04 ,  5C064AC08 ,  5C064AC11 ,  5C064AD16

前のページに戻る