特許
J-GLOBAL ID:202003008708566947

学習モデル生成装置、学習モデル生成方法、及びプログラム

発明者:
出願人/特許権者:
代理人 (3件): 泉 通博 ,  黒岩 久人 ,  寺川 賢祐
公報種別:公開公報
出願番号(国際出願番号):特願2018-244688
公開番号(公開出願番号):特開2020-107042
出願日: 2018年12月27日
公開日(公表日): 2020年07月09日
要約:
【課題】ニューラルネットワークの学習モデルの認識精度と、認識処理に要求される計算リソースとのバランスを取ることができる技術を提供する。【解決手段】事前学習部30は、1以上の畳込み層を含むニューラルネットワークの学習モデルのパラメータを学習により初期化する。畳込み層選択部31は、ニューラルネットワークを構成する畳込み層の中から、1以上の畳込み層を選択する。層構造置換部32は、畳込み層選択部31が選択した畳込み層の構造を、畳込み演算の計算量が少なくなる構造に置換した置換済みニューラルネットワークを生成する。再学習用パラメータ設定部33は、層構造置換部32が置換した層以外の層に対応する学習モデルのパラメータが事前学習部30によって初期化されたパラメータとなるように設定する。再学習部34は、学習用データを用いて置換済みニューラルネットワークの学習モデルのパラメータを生成する。【選択図】図2
請求項(抜粋):
1以上の畳込み層を含むニューラルネットワークの学習モデルを生成する学習モデル生成装置であって、 学習用データを用いて学習することによって前記学習モデルのパラメータを初期化する事前学習部と、 前記ニューラルネットワークを構成する畳込み層の中から、1以上の畳込み層を選択する畳込み層選択部と、 前記畳込み層選択部が選択した畳込み層の構造を、畳込み演算の計算量が少なくなる構造に置換した置換済みニューラルネットワークを生成する層構造置換部と、 前記層構造置換部が置換した層以外の層に対応する前記学習モデルのパラメータが前記事前学習部によって初期化されたパラメータとなるように設定する再学習用パラメータ設定部と、 前記学習用データを用いて前記置換済みニューラルネットワークの学習モデルのパラメータを生成する再学習部と、 を備える学習モデル生成装置。
IPC (1件):
G06N 3/08
FI (1件):
G06N3/08
引用特許:
出願人引用 (2件) 審査官引用 (2件)
引用文献:
前のページに戻る