特許
J-GLOBAL ID:200903045410078111

映像要約方法及びプログラム及びそのプログラムを格納した記憶媒体

発明者:
出願人/特許権者:
代理人 (1件): 伊東 忠彦
公報種別:公開公報
出願番号(国際出願番号):特願2004-156267
公開番号(公開出願番号):特開2005-341138
出願日: 2004年05月26日
公開日(公表日): 2005年12月08日
要約:
【課題】 視聴者の発声の遅延時間の大小によらず正しく重要シーンの抽出が可能で、視聴者の否定的な発言に伴う重要シーンの誤抽出の少ない映像要約を作成する。【解決手段】 本発明は、視聴者が発声した発声区間を検出し、発声区間に含まれる音声をディクテーションして、該発声区間の開始時刻から一定時間だけ遡った時点から記憶手段から映像に含まれるナレーションの文字列、テロップの文字列、セリフの文字列を抽出し、文字列とディクテーションの結果の照合し、照合した照合文字列が検出された場合に、テロップの文字列または、セリフ、または、ナレーションの存在するシーンを重要シーンと判別し、重要シーンに対応するシーン開始時刻、シーン終了時刻を出力する。【選択図】 図1
請求項(抜粋):
映像データの内容を要約する映像要約方法において、 映像視聴中の視聴者が発声した音声が記憶された音声記憶手段から、該視聴者が発声した発声区間を検出する発声区間検出ステップと、 前記発声区間に含まれる音声を音声認識(ディクテーション)して、該発声区間の開始時刻から一定時間だけ遡った時点から、映像付加情報記憶手段から映像に含まれるナレーションの文字列、テロップの文字列、セリフの文字列を抽出する文字列抽出ステップと、 前記文字列と前記ディクテーションの結果の照合を行う照合ステップと、 照合した照合文字列が検出された場合に、テロップの文字列または、セリフ、または、ナレーションの存在するシーンを、重要シーンと判別する重要シーン判断ステップと、 前記重要シーンに対応するシーン開始時刻、シーン終了時刻を前記映像付加情報記憶手段から取得して、重要シーン情報記憶手段に出力する重要シーン出力ステップと、 からなることを特徴とする映像要約方法。
IPC (5件):
H04N5/91 ,  G10L15/00 ,  H04N5/262 ,  H04N5/76 ,  H04N5/93
FI (5件):
H04N5/91 N ,  H04N5/262 ,  H04N5/76 B ,  H04N5/93 Z ,  G10L3/00 551G
Fターム (14件):
5C023AA21 ,  5C023AA34 ,  5C023CA04 ,  5C023CA05 ,  5C052AC08 ,  5C053GB06 ,  5C053GB09 ,  5C053HA29 ,  5C053JA22 ,  5C053JA24 ,  5D015AA01 ,  5D015BB02 ,  5D015CC14 ,  5D015KK01
引用特許:
出願人引用 (1件)
  • 動画像編集装置
    公報種別:公開公報   出願番号:特願平11-230683   出願人:株式会社日立国際電気, 日本放送協会

前のページに戻る