Pat
J-GLOBAL ID:200903004029617873

情報識別装置及び方法、並びにプログラム及び記録媒体

Inventor:
Applicant, Patent owner:
Agent (3): 小池 晃 ,  田村 榮一 ,  伊賀 誠司
Gazette classification:公開公報
Application number (International application number):2002286836
Publication number (International publication number):2004125944
Application date: Sep. 30, 2002
Publication date: Apr. 22, 2004
Summary:
【課題】音声信号を含む情報源から、所定の時間区間毎に高精度に音声・音楽を識別して検出する。【解決手段】スペクトログラム計算部11は、入力音声信号のスペクトルを所定のブロック単位に周波数分析し、所定の識別区間毎にスペクトログラムを求める。水平直線周波数成分抽出部13は、小ブロック毎のスペクトログラムを画像と見なして、2次元周波数領域の所定の部分領域内にある水平直線成分を抽出する。水平直線パワー比計算部14は、抽出された水平直線成分のパワーが2次元周波数領域の全領域のパワーに占める割合を求め、総合パワー比計算部15は、小ブロック毎に求めた水平直線成分パワー比を評価して、総合水平直線成分パワー比を特徴量として求める。そして、音声・音楽識別部16は、この総合水平直線成分パワー比を用いて音声か音楽かを識別する。【選択図】 図4
Claim (excerpt):
音声信号を含む情報源から所定の時間区間毎に音声か音楽かを識別する情報識別装置において、 入力音声信号を所定のブロック単位で周波数分析し、所定の識別区間毎に、縦軸及び横軸がそれぞれ周波数及び時間であるスペクトログラムを求めるスペクトログラム計算手段と、 上記スペクトログラムを画像と見なしたときの水平直流成分を抽出する水平直流成分抽出手段と、 上記水平直流成分のパワーが上記スペクトログラムの全領域のパワーに占める割合を求めるパワー比計算手段と、 上記パワー比計算手段によって求められたパワー比に基づいて、音声か音楽かを識別する識別手段と を備えることを特徴とする情報識別装置。
IPC (3):
G10L15/10 ,  G10L15/00 ,  G10L15/02
FI (3):
G10L3/00 531N ,  G10L3/00 551G ,  G10L7/08 A
F-Term (3):
5D015AA06 ,  5D015CC01 ,  5D015FF03
Patent cited by the Patent:
Cited by examiner (5)
Show all

Return to Previous Page