Pat
J-GLOBAL ID:200903045542835639
画像表示方法
Inventor:
Applicant, Patent owner:
Agent (3):
渡辺 望稔
, 三和 晴子
, 福島 弘薫
Gazette classification:公開公報
Application number (International application number):2002208491
Publication number (International publication number):2004056286
Application date: Jul. 17, 2002
Publication date: Feb. 19, 2004
Summary:
【課題】画像人物と音声の対応付けの精度を向上させ、音声を文字化したデータを精度良くその話者に対応させて表示する。【解決手段】画像データ中から人物領域を抽出し、その画像特徴量を算出し、該画像特徴量により人物を推定するとともに、音声データから音声特徴量を算出し、該音声特徴量により人物を推定し、前記画像データから推定された人物と、音声データから推定された人物とが同一シーン内に同時に発生する状況の統計をとり、前記統計の結果に基づいて、前記音声データを発した人物を特定し、前記音声データを文字化して、表示画面上で前記特定された人物の近くに表示することを特徴とする画像表示方法を提供することにより前記課題を解決する。【選択図】図2
Claim (excerpt):
音声データを伴う画像データを表示する画像表示方法であって、
画像データ中から人物領域を抽出し、その画像特徴量を算出し、該画像特徴量により人物を推定するとともに、
音声データから音声特徴量を算出し、該音声特徴量により人物を推定し、
前記画像データから推定された人物と、音声データから推定された人物とが同一シーン内に同時に発生する状況の統計をとり、
前記統計の結果に基づいて、前記音声データを発した人物を特定し、前記音声データを文字化して、表示画面上で前記特定された人物の近くに表示することを特徴とする画像表示方法。
IPC (5):
H04N5/93
, G10L15/00
, G10L17/00
, H04N5/278
, H04N5/445
FI (6):
H04N5/93 Z
, H04N5/278
, H04N5/445 Z
, H04N5/93 G
, G10L3/00 545A
, G10L3/00 551G
F-Term (26):
5C023AA18
, 5C023AA34
, 5C023AA38
, 5C023BA02
, 5C023BA11
, 5C023CA01
, 5C023CA04
, 5C023CA06
, 5C023DA00
, 5C025AA30
, 5C025BA28
, 5C025CA09
, 5C025CB10
, 5C025DA10
, 5C053FA30
, 5C053GB12
, 5C053GB21
, 5C053HA27
, 5C053JA03
, 5C053JA12
, 5C053JA16
, 5C053LA06
, 5C053LA07
, 5C053LA11
, 5D015AA03
, 5D015KK02
Return to Previous Page