特許
J-GLOBAL ID:200903024343047330
信号処理装置および方法、プログラム、並びに記録媒体
発明者:
出願人/特許権者:
代理人 (1件):
稲本 義雄
公報種別:公開公報
出願番号(国際出願番号):特願2005-187700
公開番号(公開出願番号):特開2007-013255
出願日: 2005年06月28日
公開日(公表日): 2007年01月18日
要約:
【課題】 撮影された画像内において特定の被写体から発せられる音声を強調することができるようにする。【解決手段】 画像認識部131が、画像を構成する画素のヒストグラムを生成し、人物が写っている場合の画素のヒストグラムのパターンとマッチングして相関係数を出力する。判定部132が相関係数に基づいて、画像の中に人物が写っているか否かを判定し、人物が写っていると判定された場合、指向性操作部133が前方向を重視したポーラパターンを設定し、音声帯域操作部134が人の声の周波数帯域を強調させるように音声の信号を処理する。本発明は、ビデオカメラに適用することができる。【選択図】図2
請求項(抜粋):
画像の信号と、この画像に同期した音声の信号を処理する信号処理装置であって、
入力された画像の信号に基づいて、前記画像の中に特定の被写体が写っている可能性の大きさを表す情報を生成する生成手段と、
前記生成手段により生成された情報に基づいて、前記画像の中に特定の被写体が写っているか否かを判定する判定手段と、
前記判定手段により、前記画像の中に特定の被写体が写っていると判定された場合、前記被写体方向に向けて収音した音声の信号のレベルを上げ、および、または前記被写体方向以外の方向に向けて収音した音声の信号のレベルを下げるように、前記音声の信号の指向特性を変更する指向特性変更手段と
を備えることを特徴とする信号処理装置。
IPC (4件):
H04N 5/225
, G06T 1/00
, G06T 7/00
, H04N 5/232
FI (4件):
H04N5/225 F
, G06T1/00 340A
, G06T7/00 100C
, H04N5/232 Z
Fターム (29件):
5B057BA02
, 5B057DA08
, 5B057DA12
, 5B057DB02
, 5B057DB06
, 5B057DB09
, 5B057DC25
, 5B057DC34
, 5C122DA03
, 5C122FH10
, 5C122FH11
, 5C122FH14
, 5C122FJ02
, 5C122FJ06
, 5C122HA04
, 5C122HA29
, 5C122HA88
, 5C122HB01
, 5C122HB05
, 5C122HB06
, 5L096AA02
, 5L096AA06
, 5L096BA18
, 5L096CA02
, 5L096FA15
, 5L096FA34
, 5L096GA38
, 5L096JA03
, 5L096JA11
引用特許: