特許
J-GLOBAL ID:200903095772015166

映像分類方法および装置

発明者:
出願人/特許権者:
代理人 (1件): 志賀 富士弥
公報種別:公開公報
出願番号(国際出願番号):特願平8-340293
公開番号(公開出願番号):特開平10-187182
出願日: 1996年12月20日
公開日(公表日): 1998年07月14日
要約:
【要約】【課題】 映像情報に含まれる音情報を解析し、映像を既存のジャンルにとらわれないカテゴリーに分類する映像分類方法および装置を提供する。【解決手段】 音楽検出部103は、入力された映像情報の音情報を周波数解析し、スペクトルの安定性を検出して音楽を検出する。音声検出部104は、スペクトルのハーモニック構造を検出し、音声を検出する。他方で、入力された映像情報の音情報を、符号帳生成部105にて学習データとして生成された符号帳の特徴ベクトルと音響検出部106において比較し、両者の距離の近さにより音響の種類を検出する。以上で検出された音情報の区間の位置を属性情報蓄積部107で記録し、検出された音情報の種類、各々の区間の長さ、種類毎の全体の長さ、各々の区間の位置のパターンを抽出して、映像情報の種類を映像判別部108にて判別する。
請求項(抜粋):
映像情報を入力し、該入力された映像情報に含まれる音情報から音楽、音声、音響のうち少なくとも1つが存在する区間を検出し、該検出された区間の発生パターンによって映像の種類を判別する映像分類方法であって、映像情報がアナログの場合にはA/D変換してディジタルの映像情報を入力する映像入力段階と、該映像情報に含まれる音情報を周波数解析し、スペクトルの安定性を検出するエッジ検出段階と、該スペクトルの安定性から音楽を検出する音楽検出段階と、該スペクトルのハーモニック構造を検出し、音声を検出する音声検出段階と、音響の特徴ベクトルを学習データとしてベクトル量子化し、符号帳を生成する符号帳生成段階と、該生成された符号帳と該映像情報に含まれる音情報の特徴ベクトルとを比較し、距離の近い音響を検出する音響検出段階と、該検出された音情報の種類別の区間の位置を記録する属性情報蓄積段階と、該検出された音情報の種類、各々の区間の長さ、種類毎の全体の長さ、各々の区間の位置のパターンの一以上を抽出し、該映像情報の種類を判別する映像判別段階と、を有することを特徴とする映像分類方法。
IPC (4件):
G10L 3/00 531 ,  G10L 3/00 515 ,  G10L 3/00 551 ,  H04N 5/91
FI (4件):
G10L 3/00 531 N ,  G10L 3/00 515 B ,  G10L 3/00 551 G ,  H04N 5/91 N
引用特許:
出願人引用 (7件)
全件表示
審査官引用 (11件)
全件表示

前のページに戻る