特許
J-GLOBAL ID:200903074704919289

音抽出装置

発明者:
出願人/特許権者:
代理人 (1件): 中島 淳 (外4名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-217859
公開番号(公開出願番号):特開平8-286680
出願日: 1995年08月25日
公開日(公表日): 1996年11月01日
要約:
【要約】【課題】 位置が不確定であるオブジェクトの位置を検出し且つその位置に基づいてオブジェクトが発する音を抽出する。【解決手段】 人物Aが移動した場合、複数のテレビカメラ16により部屋50の内部が継続して撮影され、音抽出装置は、それらの画像情報に基づいて、表面の多くが毛髪で覆われており黒色部分が多い略球状であるという人間の頭部に特有の特徴量を備えた領域を頭部Pに相当する領域とみなし、その位置を認識する。次に、複数のマイク22の各々により取られた採取音の音声信号における人物Aの声の部分を時間軸に沿って同期させるべく、各採取音の音声信号を、各マイク22と頭部Pの位置との距離に応じた遅延時間だけ遅延操作する。そして、遅延操作した音声信号を加算平均することにより、人物Aの声のみを抽出する。
請求項(抜粋):
音源としてのオブジェクトを含む領域を撮影する撮影手段と、前記撮影手段により撮影された領域の画像情報よりオブジェクトの位置を認識する画像認識手段と、予め定められた位置に配置され前記オブジェクトが発する音を採取する複数のマイクロフォンと、前記複数のマイクロフォンの各々により採取された採取音の時系列データのうち複数の採取音の時系列データを選択し、選択した採取音の時系列データを、前記画像認識手段により認識されたオブジェクトの位置及び該選択した採取音を採取したマイクロフォンの位置に基づいて、オブジェクトが発する音が同期するようにシフトし、シフトした採取音の時系列データを平均することにより、オブジェクトが発する音を抽出する抽出手段と、を有する音抽出装置。
IPC (6件):
G10K 15/00 ,  G06T 7/00 ,  G10K 15/12 ,  G10L 3/00 511 ,  G10L 3/00 551 ,  H04N 7/18
FI (9件):
G10K 15/00 L ,  G10L 3/00 511 ,  G10L 3/00 551 G ,  H04N 7/18 D ,  H04N 7/18 K ,  G06F 15/62 415 ,  G06F 15/70 460 C ,  G10K 15/00 M ,  G10K 15/00 B
引用特許:
審査官引用 (3件)
  • カメラ監視システム
    公報種別:公開公報   出願番号:特願平4-029448   出願人:三洋電機株式会社
  • 能動型騒音制御装置
    公報種別:公開公報   出願番号:特願平3-220662   出願人:日産自動車株式会社, 株式会社日立製作所
  • 物体の位置計測装置
    公報種別:公開公報   出願番号:特願平4-299677   出願人:富士通株式会社

前のページに戻る