特許
J-GLOBAL ID:201903007098949213

ニューラルアーキテクチャ検索

発明者:
出願人/特許権者:
代理人 (3件): 村山 靖彦 ,  実広 信哉 ,  阿部 達彦
公報種別:公表公報
出願番号(国際出願番号):特願2019-522868
公開番号(公開出願番号):特表2019-533257
出願日: 2017年10月27日
公開日(公表日): 2019年11月14日
要約:
ニューラルネットワークアーキテクチャを決定するための、コンピュータ記憶媒体上に符号化されたコンピュータプログラムを含む方法、システム、および装置が開示される。本方法の1つは、コントローラニューラルネットワークを使用して、出力シーケンスのバッチを生成するステップであって、バッチ内の各出力シーケンスが、特定のニューラルネットワークタスクを実行するように構成される子ニューラルネットワークのそれぞれのアーキテクチャを定義するステップと、バッチ内の出力シーケンスごとに、出力シーケンスによって定義されたアーキテクチャを有する子ニューラルネットワークのそれぞれのインスタンスをトレーニングするステップと、特定のニューラルネットワークタスクにおける子ニューラルネットワークのトレーニング済みインスタンスの性能メトリックを決定するために、特定のニューラルネットワークタスクにおける子ニューラルネットワークのトレーニング済みインスタンスの性能を評価するステップと、コントローラニューラルネットワークのコントローラパラメータの現在値を調整するために、子ニューラルネットワークのトレーニング済みインスタンスの性能メトリックを使用するステップとを含む。
請求項(抜粋):
複数のコントローラパラメータを有するコントローラニューラルネットワークを使用して、前記コントローラパラメータの現在値に従って、出力シーケンスのバッチを生成するステップであって、前記バッチ内の各出力シーケンスが、特定のニューラルネットワークタスクを実行するように構成される子ニューラルネットワークのそれぞれのアーキテクチャを定義する、ステップと、 前記バッチ内の出力シーケンスごとに、 前記特定のニューラルネットワークタスクを実行するために、前記出力シーケンスによって定義された前記アーキテクチャを有する前記子ニューラルネットワークのそれぞれのインスタンスをトレーニングするステップと、 前記特定のニューラルネットワークタスクにおける前記子ニューラルネットワークの前記トレーニング済みインスタンスの性能メトリックを決定するために、前記特定のニューラルネットワークタスクにおける前記子ニューラルネットワークの前記トレーニング済みインスタンスの性能を評価するステップと を含み、 前記コントローラニューラルネットワークの前記コントローラパラメータの前記現在値を調整するために、前記子ニューラルネットワークの前記トレーニング済みインスタンスの前記性能メトリックを使用するステップと を含む、方法。
IPC (2件):
G06N 3/08 ,  G06N 3/04
FI (2件):
G06N3/08 ,  G06N3/04 145
引用文献:
出願人引用 (2件)
  • Neural Architecture Search with Reinforcement Learning
  • Learning to Compose Neural Networks for Question Answering
審査官引用 (2件)
  • Neural Architecture Search with Reinforcement Learning
  • Learning to Compose Neural Networks for Question Answering

前のページに戻る