特許
J-GLOBAL ID:200903050091009121

オーディオ情報分類装置

発明者:
出願人/特許権者:
代理人 (1件): 田中 香樹 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-235543
公開番号(公開出願番号):特開2000-066691
出願日: 1998年08月21日
公開日(公表日): 2000年03月03日
要約:
【要約】【課題】 簡単かつ高速に、無音/有音区間の判別、音楽区間と音声区間、あるいは音楽区間と音声区間と雑音区間に分類することを可能とするオーディオ情報分類装置を提供することにある。【解決手段】 有音判定部4はエネルギー分散演算部3で求められた値σe 2が閾値より大きい時有音と判定する。有音と判定されると、メモリ5に格納されていたオーディオ情報が読み出されて、全サブバンドエネルギー和演算部7とサブバンドエネルギー重心演算部11に入力される。前記演算部7の出力は2値化演算部8で2値化され、2値化数列分散演算部9で2値化数列の単位時間内の分散σs 2 が求められる。一方、エネルギー重心平均・分散演算部12はエネルギー重心平均Eg と分散σg 2 を求める。オーディオ情報識別部10は、前記分散σs 2 、エネルギー重心平均Eg 、および分散σg 2 に対して識別関数を用いて、雑音、音楽、音声の判別を行う。
請求項(抜粋):
オーディオ情報から音声区間と音楽区間を分類するオーディオ情報分類装置において、入力されたオーディオ情報から単位時間ごとの周波数データを抽出するオーディオ周波数データ抽出手段と、抽出した単位時間ごとの周波数データのエネルギーの分散を求め、分散値の大きさにより無音/有音区間を判定する無音/有音判定手段とを具備することを特徴とするオーディオ情報分類装置。
IPC (3件):
G10L 11/00 ,  G10L 11/06 ,  G10L 19/00
FI (4件):
G10L 7/02 A ,  G10L 9/00 C ,  G10L 9/16 ,  G10L 9/18 H
引用特許:
審査官引用 (4件)
全件表示

前のページに戻る