特許
J-GLOBAL ID:200903095772015166
映像分類方法および装置
発明者:
,
,
出願人/特許権者:
代理人 (1件):
志賀 富士弥
公報種別:公開公報
出願番号(国際出願番号):特願平8-340293
公開番号(公開出願番号):特開平10-187182
出願日: 1996年12月20日
公開日(公表日): 1998年07月14日
要約:
【要約】【課題】 映像情報に含まれる音情報を解析し、映像を既存のジャンルにとらわれないカテゴリーに分類する映像分類方法および装置を提供する。【解決手段】 音楽検出部103は、入力された映像情報の音情報を周波数解析し、スペクトルの安定性を検出して音楽を検出する。音声検出部104は、スペクトルのハーモニック構造を検出し、音声を検出する。他方で、入力された映像情報の音情報を、符号帳生成部105にて学習データとして生成された符号帳の特徴ベクトルと音響検出部106において比較し、両者の距離の近さにより音響の種類を検出する。以上で検出された音情報の区間の位置を属性情報蓄積部107で記録し、検出された音情報の種類、各々の区間の長さ、種類毎の全体の長さ、各々の区間の位置のパターンを抽出して、映像情報の種類を映像判別部108にて判別する。
請求項(抜粋):
映像情報を入力し、該入力された映像情報に含まれる音情報から音楽、音声、音響のうち少なくとも1つが存在する区間を検出し、該検出された区間の発生パターンによって映像の種類を判別する映像分類方法であって、映像情報がアナログの場合にはA/D変換してディジタルの映像情報を入力する映像入力段階と、該映像情報に含まれる音情報を周波数解析し、スペクトルの安定性を検出するエッジ検出段階と、該スペクトルの安定性から音楽を検出する音楽検出段階と、該スペクトルのハーモニック構造を検出し、音声を検出する音声検出段階と、音響の特徴ベクトルを学習データとしてベクトル量子化し、符号帳を生成する符号帳生成段階と、該生成された符号帳と該映像情報に含まれる音情報の特徴ベクトルとを比較し、距離の近い音響を検出する音響検出段階と、該検出された音情報の種類別の区間の位置を記録する属性情報蓄積段階と、該検出された音情報の種類、各々の区間の長さ、種類毎の全体の長さ、各々の区間の位置のパターンの一以上を抽出し、該映像情報の種類を判別する映像判別段階と、を有することを特徴とする映像分類方法。
IPC (4件):
G10L 3/00 531
, G10L 3/00 515
, G10L 3/00 551
, H04N 5/91
FI (4件):
G10L 3/00 531 N
, G10L 3/00 515 B
, G10L 3/00 551 G
, H04N 5/91 N
引用特許:
審査官引用 (8件)
-
音可視化方法および装置
公報種別:公開公報
出願番号:特願平6-318122
出願人:日本電信電話株式会社
-
画像検索方法及び画像検索装置
公報種別:公開公報
出願番号:特願平5-252798
出願人:シャープ株式会社
-
特開平3-080782
-
特開平2-121500
-
オーデイオ帯域信号の音声/音楽判別装置
公報種別:公開公報
出願番号:特願平3-332247
出願人:三星電子株式会社
-
特開昭63-107393
-
特開昭62-070898
-
特開平4-127200
全件表示
前のページに戻る