特許
J-GLOBAL ID:201903006133059840
学習装置、学習方法、プログラム、データ生成方法及び識別装置
発明者:
出願人/特許権者:
代理人 (2件):
河野 英仁
, 河野 登夫
公報種別:公開公報
出願番号(国際出願番号):特願2018-095725
公開番号(公開出願番号):特開2019-200671
出願日: 2018年05月17日
公開日(公表日): 2019年11月21日
要約:
【課題】顔画像及び発声データを識別する識別モデルを教師なし学習で構築することができる学習装置等を提供する。【解決手段】学習装置1は、人物の顔を撮像した顔画像と、該人物の発声データとが夫々対応付けられた複数のデータセットを取得する取得部と、前記複数のデータセット夫々の前記顔画像を第1の抽出器に入力し、前記顔画像の特徴量を抽出する第1抽出部と、前記複数のデータセット夫々の前記発声データを第2の抽出器に入力し、前記発声データの特徴量を抽出する第2抽出部と、前記顔画像及び発声データ夫々の特徴量と、前記データセットにおける前記顔画像及び発声データの対応関係とに基づき、前記第1及び第2の抽出器を用いて前記顔画像及び発声データを識別する識別器を生成する生成部とを備えることを特徴とする。【選択図】図1
請求項(抜粋):
人物の顔を撮像した顔画像と、該人物の発声データとが夫々対応付けられた複数のデータセットを取得する取得部と、
前記複数のデータセット夫々の前記顔画像を第1の抽出器に入力し、前記顔画像の特徴量を抽出する第1抽出部と、
前記複数のデータセット夫々の前記発声データを第2の抽出器に入力し、前記発声データの特徴量を抽出する第2抽出部と、
前記顔画像及び発声データ夫々の特徴量と、前記データセットにおける前記顔画像及び発声データの対応関係とに基づき、前記第1及び第2の抽出器を用いて前記顔画像及び発声データを識別する識別器を生成する生成部と
を備えることを特徴とする学習装置。
IPC (3件):
G06T 7/00
, G06N 20/00
, G10L 15/25
FI (6件):
G06T7/00 P
, G06N99/00 153
, G06N99/00 156
, G06T7/00 660A
, G06T7/00 350C
, G10L15/25
Fターム (9件):
5L096AA06
, 5L096EA13
, 5L096EA39
, 5L096GA51
, 5L096GA55
, 5L096HA09
, 5L096HA11
, 5L096KA04
, 5L096MA07
引用特許:
引用文献:
前のページに戻る