Pat
J-GLOBAL ID:200903095772015166

映像分類方法および装置

Inventor:
Applicant, Patent owner:
Agent (1): 志賀 富士弥
Gazette classification:公開公報
Application number (International application number):1996340293
Publication number (International publication number):1998187182
Application date: Dec. 20, 1996
Publication date: Jul. 14, 1998
Summary:
【要約】【課題】 映像情報に含まれる音情報を解析し、映像を既存のジャンルにとらわれないカテゴリーに分類する映像分類方法および装置を提供する。【解決手段】 音楽検出部103は、入力された映像情報の音情報を周波数解析し、スペクトルの安定性を検出して音楽を検出する。音声検出部104は、スペクトルのハーモニック構造を検出し、音声を検出する。他方で、入力された映像情報の音情報を、符号帳生成部105にて学習データとして生成された符号帳の特徴ベクトルと音響検出部106において比較し、両者の距離の近さにより音響の種類を検出する。以上で検出された音情報の区間の位置を属性情報蓄積部107で記録し、検出された音情報の種類、各々の区間の長さ、種類毎の全体の長さ、各々の区間の位置のパターンを抽出して、映像情報の種類を映像判別部108にて判別する。
Claim (excerpt):
映像情報を入力し、該入力された映像情報に含まれる音情報から音楽、音声、音響のうち少なくとも1つが存在する区間を検出し、該検出された区間の発生パターンによって映像の種類を判別する映像分類方法であって、映像情報がアナログの場合にはA/D変換してディジタルの映像情報を入力する映像入力段階と、該映像情報に含まれる音情報を周波数解析し、スペクトルの安定性を検出するエッジ検出段階と、該スペクトルの安定性から音楽を検出する音楽検出段階と、該スペクトルのハーモニック構造を検出し、音声を検出する音声検出段階と、音響の特徴ベクトルを学習データとしてベクトル量子化し、符号帳を生成する符号帳生成段階と、該生成された符号帳と該映像情報に含まれる音情報の特徴ベクトルとを比較し、距離の近い音響を検出する音響検出段階と、該検出された音情報の種類別の区間の位置を記録する属性情報蓄積段階と、該検出された音情報の種類、各々の区間の長さ、種類毎の全体の長さ、各々の区間の位置のパターンの一以上を抽出し、該映像情報の種類を判別する映像判別段階と、を有することを特徴とする映像分類方法。
IPC (4):
G10L 3/00 531 ,  G10L 3/00 515 ,  G10L 3/00 551 ,  H04N 5/91
FI (4):
G10L 3/00 531 N ,  G10L 3/00 515 B ,  G10L 3/00 551 G ,  H04N 5/91 N
Patent cited by the Patent:
Cited by examiner (11)
  • 音可視化方法および装置
    Gazette classification:公開公報   Application number:特願平6-318122   Applicant:日本電信電話株式会社
  • 画像検索方法及び画像検索装置
    Gazette classification:公開公報   Application number:特願平5-252798   Applicant:シャープ株式会社
  • 特開平3-080782
Show all

Return to Previous Page