特許
J-GLOBAL ID:200903004241473229
プログラム、記録媒体、情報処理方法、および情報処理装置
発明者:
出願人/特許権者:
代理人 (1件):
稲本 義雄
公報種別:公開公報
出願番号(国際出願番号):特願2001-112757
公開番号(公開出願番号):特開2002-311988
出願日: 2001年04月11日
公開日(公表日): 2002年10月25日
要約:
【要約】【課題】 言語音声単位と画像概念を適切に獲得できるようにする。【解決手段】 隠れマルコフモデルにより音声セグメントモデルA,B,Cが表され、その遷移系列が単語とされる。音声特徴量と画像特徴量の相互情報量が最大となるカテゴリの数が検出され、さらに、検出されたカテゴリの数のうち最小のものが選択され、カテゴリの数が最小の相互情報量に対応するカテゴリが取得される。これにより、言語音声単位と画像概念が適切に獲得される。
請求項(抜粋):
音声と画像を含むデータを取得する第1の取得ステップと、前記第1の取得ステップの処理により取得された前記データから、語彙に相当する複数のカテゴリを抽出する抽出ステップと、前記抽出ステップの処理により抽出された前記カテゴリから、音声特徴量と画像特徴量の相互情報量を演算する演算ステップと、前記演算ステップの処理により演算された前記相互情報量が最大となるカテゴリの数を検出する検出ステップと、前記検出ステップの処理により検出された前記カテゴリの数のうち、最小のものを選択する選択ステップと、前記選択ステップの処理により選択された前記カテゴリの数が最小の前記相互情報量に対応する前記カテゴリを取得する第2の取得ステップとをコンピュータに実行させるプログラム。
IPC (7件):
G10L 15/14
, G06F 17/30 170
, G06F 17/30
, G06T 7/00
, G10L 13/04
, G10L 15/18
, G10L 15/24
FI (7件):
G06F 17/30 170 B
, G06F 17/30 170 E
, G06T 7/00 P
, G10L 3/00 535 B
, G10L 5/02 G
, G10L 3/00 571 Q
, G10L 3/00 537 C
Fターム (8件):
5B075ND08
, 5B075ND14
, 5B075NK39
, 5B075QM10
, 5D015HH23
, 5L096DA02
, 5L096HA09
, 5L096JA22
前のページに戻る