特許
J-GLOBAL ID:200903002145804181

デジタルビデオデータから索引付け情報を抽出する方法と装置

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-267161
公開番号(公開出願番号):特開平10-136297
出願日: 1997年09月30日
公開日(公表日): 1998年05月22日
要約:
【要約】【課題】 ビデオテープにおける特定の競技行為の所在位置を自動的に索引付けする方法と装置を提供すること。【解決手段】 競技プレーが発生する所在位置の索引を、会話検知アルゴリズムとビデオ解析アルゴリズムを用いて作成する。会話検知アルゴリズムはビデオテープのオーディオデータ部に特定のことばを割り当てる。次に、特定のことばが検知される所在位置情報をビデオ解析アルゴリズムに転送し、各所在位置に対して範囲を設定し、各範囲はヒストグラム技法を用いて複数のショットに区分する。ビデオ解析アルゴリズムは、ライン抽出技法を用いて、任意のビデオ特徴に対して各区分範囲を解析し、競技プレーを識別する。ビデオ解析により、ビデオテープにおける競技プレーの所在位置に対して1組のポインタ、すなわち、索引を、最終的に作成出力する。
請求項(抜粋):
音声映像データ内に発生する第1の演技データの所在位置を示す索引を作成するためのコンピュータ内蔵型の会話および映像解析システムにおいて、上記音声映像データは複数の演技を表す映像データと同期した音声データを含み、上記第1の演技データは、該第1の演技を表す少なくとも1つの音声特徴と少なくとも1つの映像特徴を有し、(a)上記音声特徴を表す会話モデルを格納するためのモデル会話データベースを供給する工程と、(b)上記映像特徴を表す映像モデルを格納するためのモデル映像データベースを供給する工程と、(c)上記音声データと上記格納された会話モデルとを比較することにより、上記音声データ内の音声特徴の位置を表す候補を決定するためのワードスポット処理工程と、(d)上記各候補に対して所定の範囲を設定する工程と、(e)上記範囲内に所在決定される映像データ部を複数のショットに区分する工程と、(f)上記区分された映像データを解析し、該区分された映像データと上記格納映像モデルとの比較により、上記区分映像データ内の映像特徴の位置を示す映像所在位置を決定する工程と、(g)上記映像所在位置により上記第1の演技データの所在位置を示す索引を作成する工程、とを有する索引作成方法。
IPC (5件):
H04N 5/7826 ,  G06F 17/30 ,  G10L 3/00 531 ,  G10L 3/00 551 ,  H04N 5/91
FI (6件):
H04N 5/782 A ,  G10L 3/00 531 C ,  G10L 3/00 551 G ,  G06F 15/40 370 D ,  G06F 15/40 370 E ,  H04N 5/91 N
引用特許:
出願人引用 (2件) 審査官引用 (2件)

前のページに戻る