特許
J-GLOBAL ID:201003040040440621

再生装置

発明者:
出願人/特許権者:
代理人 (1件): 田中 常雄
公報種別:公開公報
出願番号(国際出願番号):特願2008-307089
公開番号(公開出願番号):特開2010-134507
出願日: 2008年12月02日
公開日(公表日): 2010年06月17日
要約:
【課題】 画像には顔が現れずに声だけが聞こえる人物を視覚的に確認できるようにする。【解決手段】 データベース(16)には、複数人について、顔画像データとその特徴量、声データとその特徴量が登録されている。人声認識部(32)及び人声照合部(34)により、再生音声信号に含まれる人声の特徴量をデータベースに照合して、発声者を探索する。顔画像認識部(20)及びは顔画像照合部(22)により、再生画像信号に含まれる顔画像の特徴量をデータベース(16)に照合して、画面内の人物を探索する。付加画像表示判定部(40)は、探索された発生者から、探索された人物を除外し、画面外の話者を特定する。付加画像生成部(24)は、特定された話者の付加画像をデータベース(16)から読み出し、表示画像生成部(26)に供給する。表示画像生成部(26)は、付加画像を再生画像信号に合成する。【選択図】図1
請求項(抜粋):
記録媒体から読み出した画像データを再生し、再生画像信号を出力する画像処理手段と、 前記記録媒体から読み出した音声データを再生し、再生音声信号を出力する音声処理手段と、 複数人の声データと顔画像データを記録したデータベースと、 前記再生音声信号から人声を判別し認識する人声認識手段と、 前記人声認識手段で認識された人声と前記データベースに登録された声データとを照合し同定する人声照合手段と、 前記再生画像信号から人物の顔を判別し認識する顔画像認識手段と、 前記顔画像認識手段で認識された人物の顔と前記データベースに登録された顔画像データとを照合し同定する顔画像照合手段と、 同一シーン中の前記人声照合手段で同定された人物から前記顔画像照合手段で同定された人物を除外した人物を、付加画像表示の対象として決定する付加画像表示判定手段と、 前記データベースから前記付加画像表示判定手段で決定された対象の人物を示す情報を読み出して、前記再生画像信号に合成すべき付加画像を生成する付加画像生成手段と、 前記再生画像信号に前記付加画像を合成する表示画像生成手段 とを有することを特徴とする再生装置。
IPC (3件):
G06F 3/16 ,  G10L 15/04 ,  G10L 17/00
FI (5件):
G06F3/16 320G ,  G06F3/16 340K ,  G10L15/04 300A ,  G10L17/00 200B ,  G06F3/16 330C
Fターム (1件):
5D015AA03
引用特許:
出願人引用 (1件)
  • 特開平2-67889号公報

前のページに戻る