特許
J-GLOBAL ID:200903072503629328

認識装置および認識方法、学習装置および学習方法、並びに記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 稲本 義雄
公報種別:公開公報
出願番号(国際出願番号):特願2000-376911
公開番号(公開出願番号):特開2002-182685
出願日: 2000年12月12日
公開日(公表日): 2002年06月26日
要約:
【要約】【課題】 認識性能を向上させる。【解決手段】 同期処理部2は、入力された画像と音声を同期させ、特徴抽出部3は、その同期された画像と音声それぞれから、特徴量を抽出して、その画像と音声の特徴量を合成した合成特徴量を得る。学習部7は、その合成特徴量に基づいて学習を行い、同一概念を表す画像および音声に対応するモデルを生成し、そのモデルと、その画像および音声の概念を表す概念情報とを対応付けた辞書を生成する。一方、認識処理部5は、合成特徴量と、辞書におけるモデルとを用いてマッチングを行うことにより、入力された画像と音声が表す概念を認識する。
請求項(抜粋):
同一概念を表す画像および音声のモデルと、その概念を表す概念情報とを対応付けた辞書を記憶する記憶手段と、入力された画像と音声を同期させる同期手段と、同期された前記画像と音声それぞれから、特徴量を抽出し、その画像と音声の特徴量を合成した合成特徴量を出力する抽出手段と、前記抽出手段において出力される合成特徴量と、前記辞書におけるモデルとを用いてマッチングを行うことにより、入力された画像と音声が表す概念を認識する認識手段とを備えることを特徴とする認識装置。
IPC (5件):
G10L 15/18 ,  G06T 7/00 ,  G06T 7/00 300 ,  G10L 15/00 ,  G10L 15/24
FI (5件):
G06T 7/00 P ,  G06T 7/00 300 F ,  G10L 3/00 537 Z ,  G10L 3/00 551 H ,  G10L 3/00 571 Q
Fターム (8件):
5D015FF00 ,  5D015HH04 ,  5L096BA05 ,  5L096FA23 ,  5L096GA41 ,  5L096HA04 ,  5L096JA11 ,  5L096KA04
引用特許:
審査官引用 (7件)
全件表示

前のページに戻る