特許
J-GLOBAL ID:200903045542835639

画像表示方法

発明者:
出願人/特許権者:
代理人 (3件): 渡辺 望稔 ,  三和 晴子 ,  福島 弘薫
公報種別:公開公報
出願番号(国際出願番号):特願2002-208491
公開番号(公開出願番号):特開2004-056286
出願日: 2002年07月17日
公開日(公表日): 2004年02月19日
要約:
【課題】画像人物と音声の対応付けの精度を向上させ、音声を文字化したデータを精度良くその話者に対応させて表示する。【解決手段】画像データ中から人物領域を抽出し、その画像特徴量を算出し、該画像特徴量により人物を推定するとともに、音声データから音声特徴量を算出し、該音声特徴量により人物を推定し、前記画像データから推定された人物と、音声データから推定された人物とが同一シーン内に同時に発生する状況の統計をとり、前記統計の結果に基づいて、前記音声データを発した人物を特定し、前記音声データを文字化して、表示画面上で前記特定された人物の近くに表示することを特徴とする画像表示方法を提供することにより前記課題を解決する。【選択図】図2
請求項(抜粋):
音声データを伴う画像データを表示する画像表示方法であって、 画像データ中から人物領域を抽出し、その画像特徴量を算出し、該画像特徴量により人物を推定するとともに、 音声データから音声特徴量を算出し、該音声特徴量により人物を推定し、 前記画像データから推定された人物と、音声データから推定された人物とが同一シーン内に同時に発生する状況の統計をとり、 前記統計の結果に基づいて、前記音声データを発した人物を特定し、前記音声データを文字化して、表示画面上で前記特定された人物の近くに表示することを特徴とする画像表示方法。
IPC (5件):
H04N5/93 ,  G10L15/00 ,  G10L17/00 ,  H04N5/278 ,  H04N5/445
FI (6件):
H04N5/93 Z ,  H04N5/278 ,  H04N5/445 Z ,  H04N5/93 G ,  G10L3/00 545A ,  G10L3/00 551G
Fターム (26件):
5C023AA18 ,  5C023AA34 ,  5C023AA38 ,  5C023BA02 ,  5C023BA11 ,  5C023CA01 ,  5C023CA04 ,  5C023CA06 ,  5C023DA00 ,  5C025AA30 ,  5C025BA28 ,  5C025CA09 ,  5C025CB10 ,  5C025DA10 ,  5C053FA30 ,  5C053GB12 ,  5C053GB21 ,  5C053HA27 ,  5C053JA03 ,  5C053JA12 ,  5C053JA16 ,  5C053LA06 ,  5C053LA07 ,  5C053LA11 ,  5D015AA03 ,  5D015KK02

前のページに戻る