抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
適応最適化性能の改善に向けた貢献を行った。この改善は,AdaBelief最適化器における適応ステップの範囲の抑制に基づいている。最初に,AdaBeliefの更新表現内のパラメータε′′の特定の配置が適応ステップの範囲を低減し,AdaBeliefを運動量によりSGDに近づけることを示した。第二に,適応ステップの範囲をさらに抑制することによってAdaBeliefを拡張した。上記の目標を達成するために,著者らは,勾配g_tとその最初の運動量m_tの間の相互層別ベクトル射影を,それらを用いて二次運動量を推定する前に実行した。新しい最適化手法はAidaと呼ばれる。第3に,広範な実験結果は,Aidaが,NLPのための変圧器とLSTMを訓練するとき,9つの最適化者と,CIAF10とCIFAR100に関する画像分類のためのVGGとResNetを,画像生成タスクのためにWGAN-GPモデルを訓練するとき,9つの方法の最良の性能に整合するのを示している。さらに,AidaはAdaBeliefより高い検証精度を,ImageNet上でResNet18を訓練するために生産する。このURLではコードが利用可能である。【JST・京大機械翻訳】