特許
J-GLOBAL ID:202203008588113565
情報処理装置、情報処理プログラム及び情報処理方法
発明者:
,
,
,
,
出願人/特許権者:
代理人 (3件):
泉 通博
, 久恒 京範
, 寺川 賢祐
公報種別:公開公報
出願番号(国際出願番号):特願2020-130113
公開番号(公開出願番号):特開2022-026573
出願日: 2020年07月31日
公開日(公表日): 2022年02月10日
要約:
【課題】調査者が被調査者に対して行う調査のために、被調査者の環境において重要な領域を特定できるようにする。
【解決手段】情報処理装置1は、調査者の視線を特定する視線特定部142と、会話を取得する会話取得部143と、撮像画像を取得する撮像画像取得部141と、撮像画像の特徴を示す第1画像特徴量と、視線方向画像の特徴を示す第2画像特徴量と、会話の文の特徴を示す文特徴量とを機械学習することによって、第1時刻における第1画像特徴量から、第2時刻における第2画像特徴量及び文特徴量を予測し、さらに第2時刻における第1画像特徴量、第2画像特徴量及び文特徴量から、第3時刻における第2画像特徴量及び文特徴量を再帰的に予測するための予測モデルを生成する学習部145と、予測モデルに新たな撮像画像を入力することによって予測された第2画像特徴量に対応する領域を示す情報を出力する出力部146と、を有する。
【選択図】図2
請求項(抜粋):
被調査者と会話をしている調査者の視線を特定する視線特定部と、
前記調査者と前記被調査者との前記会話を取得する会話取得部と、
前記会話中に前記調査者及び前記被調査者を含む環境を撮像した撮像画像を取得する撮像画像取得部と、
前記撮像画像の特徴を示す第1画像特徴量と、前記撮像画像の少なくとも一部の画像であって前記視線の先にあたる注視点を含む視線方向画像の特徴を示す第2画像特徴量と、前記会話の文の特徴を示す文特徴量とを機械学習することによって、第1時刻における前記第1画像特徴量から、前記第1時刻より後の第2時刻における前記第2画像特徴量及び前記文特徴量を予測し、さらに前記第2時刻における前記第1画像特徴量、予測された前記第2時刻における前記第2画像特徴量及び予測された前記第2時刻における前記文特徴量から、前記第2時刻より後の第3時刻における前記第2画像特徴量及び前記文特徴量を再帰的に予測するための予測モデルを生成する学習部と、
前記予測モデルに新たな撮像画像を入力することによって予測された前記第2画像特徴量に対応する領域を示す情報を出力する出力部と、
を有する、情報処理装置。
IPC (1件):
FI (2件):
G06T7/00 P
, G06T7/00 660A
Fターム (14件):
5L096AA02
, 5L096AA06
, 5L096AA09
, 5L096BA02
, 5L096BA16
, 5L096BA17
, 5L096CA05
, 5L096EA23
, 5L096FA66
, 5L096FA67
, 5L096FA69
, 5L096JA05
, 5L096JA11
, 5L096KA04
引用特許:
前のページに戻る