特許
J-GLOBAL ID:200903056216069316

字幕挿入方法、字幕挿入システム、および字幕挿入プログラム

発明者:
出願人/特許権者:
代理人 (2件): 岩壁 冬樹 ,  須藤 浩
公報種別:公開公報
出願番号(国際出願番号):特願2003-138458
公開番号(公開出願番号):特開2004-343488
出願日: 2003年05月16日
公開日(公表日): 2004年12月02日
要約:
【課題】映像情報に含まれる音声情報の音声認識処理結果と、映像情報に含まれる画像情報の登場人物の認識結果とに基づいて、正確な字幕の挿入位置を決定する。【解決手段】フレーム画像入力手段2は画像情報を入力し、音声入力手段は音声情報を入力する。字幕原稿入力手段4は、せりふと話者とを示す情報を含む字幕原稿を入力し、字幕原稿記憶手段5は入力された原稿を記憶する。音声認識手段6は音声情報に対して音声認識処理を行って、せりふが現れるタイミングを検出する。顔認識手段7は、画像情報による画像において話者の顔が現れるタイミングを検出する。字幕挿入手段9は、音声認識手段6が検出したタイミングの情報を入力し、顔認識手段7が検出したタイミングの情報を入力したら、いずれかのタイミングに相当する時点で、映像情報に字幕を挿入する。【選択図】 図1
請求項(抜粋):
映像情報に含まれる音声情報に音声認識処理を行って、字幕に対応するせりふの前記音声情報における発生タイミングを検出し、 映像情報に含まれる画像情報に顔認識処理を行って、せりふの話者が画像に現れる出現タイミングを検出し、 前記発生タイミングと前記出現タイミングとに基づいて字幕を画像情報に挿入する ことを特徴とする字幕挿入方法。
IPC (5件):
H04N5/278 ,  G06T1/00 ,  G06T7/20 ,  G06T7/60 ,  G10L15/00
FI (5件):
H04N5/278 ,  G06T1/00 340A ,  G06T7/20 A ,  G06T7/60 150B ,  G10L3/00 551G
Fターム (22件):
5B057AA20 ,  5B057CA12 ,  5B057CB12 ,  5B057CE08 ,  5B057CH01 ,  5B057CH11 ,  5B057DA07 ,  5B057DC33 ,  5C023AA18 ,  5C023AA27 ,  5C023AA28 ,  5C023BA01 ,  5C023BA11 ,  5C023CA02 ,  5C023CA04 ,  5C023CA05 ,  5C023CA08 ,  5D015KK02 ,  5L096BA20 ,  5L096DA04 ,  5L096FA69 ,  5L096HA02
引用特許:
審査官引用 (4件)
  • 番組解説自動送出装置
    公報種別:公開公報   出願番号:特願平9-218296   出願人:松下電器産業株式会社
  • オープンキャプションに対する字幕表示制御方法
    公報種別:公開公報   出願番号:特願2001-148426   出願人:通信・放送機構, 財団法人エヌエイチケイエンジニアリングサービス, 日本放送協会
  • テロップ装置
    公報種別:公開公報   出願番号:特願2001-265313   出願人:日本放送協会
全件表示

前のページに戻る