特許
J-GLOBAL ID:200903064442987363

広帯域音響検出方法および装置およびこのプログラム記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 草野 卓 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-123601
公開番号(公開出願番号):特開2000-315094
出願日: 1999年04月30日
公開日(公表日): 2000年11月14日
要約:
【要約】【課題】 音情報やこれを含む映像情報から、拍手のような広帯域音響を検出する。【解決手段】 入力音情報をFFTし(204)、そのサウンドスペクトログラムの周波数iにおける時間方向のエッジ強度ediを求め(206)、ediの強度がしきい値以上の部分は音楽成分としてそのスペクトルを除去し(208)、除去された部分を周辺のスペクトルで補間し(209)、その除去、補間したスペクトログラムを2値画像とし(211)、この2値画像の全ての画素について、着目画素が0で周辺画素の何れかが1であれば、着目画素を1とする拡散処理を指定回数行い(212,213)、その後、その全画素について、着目画素が1で周辺画素の何れかが0であれば着目画素を0とする収縮処理を指定回数行い(214,215)、しきい値以上の画素が密にある部分を強調し、そのしきい値以上の画素領域の面積を求め(216)、その面積が所定値以上の時間区間を広帯域音響区間とする(217)。
請求項(抜粋):
音情報から広帯域に分布する信号を検出する音響検出方法であって、音情報あるいは音情報を含む映像情報を入力し、該音情報あるいは該映像情報に含まれる音情報を周波数解析し、その周波数解析結果から、ある値以上のパワーで広帯域に分布するスペクトルの量を算出し、そのスペクトルの量がある値以上の値を保ったまま時間的に連続した時間区間を求め、その時間区間を広帯域音響区間として前記音情報あるいは映像情報と対応付けて記録することを特徴とする広帯域音響検出方法。
IPC (6件):
G10L 15/10 ,  G10L 15/00 ,  G10L 15/20 ,  G10L 21/02 ,  G10L 21/06 ,  G06T 7/00
FI (6件):
G10L 7/08 B ,  G10L 3/00 531 N ,  G10L 3/00 551 G ,  G10L 3/02 301 A ,  G10L 7/10 ,  G06F 15/70 330 F
Fターム (21件):
5D015AA06 ,  5D015CC03 ,  5D015DD05 ,  5D015EE01 ,  5D015EE04 ,  5D015KK00 ,  5D015LL05 ,  5L096BA16 ,  5L096EA02 ,  5L096EA43 ,  5L096FA06 ,  5L096FA19 ,  5L096FA23 ,  5L096FA59 ,  5L096GA17 ,  5L096GA51 ,  9A001EE02 ,  9A001GG03 ,  9A001GZ14 ,  9A001HZ15 ,  9A001HZ16

前のページに戻る