抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
非凸関数を最適化するために,確率的勾配降下(SGD)は日常的に使用されている。しかし,滑らかな非凸設定におけるSGDに対する標準収束理論は,定常点に対して遅い線形収束を与える。本研究では,いくつかの余分な構造仮定を満たす非凸問題に対する大域的最小への収束を示すSGDに対するいくつかの収束定理を提供した。特に,2つの大きなクラスの構造化非凸関数に焦点を当てた。(i)Quasar(Strongly)Convex関数(凸関数の一般化)と(ii)Polyak-Lojasiwicz条件(強凸関数の一般化)を満たす関数。本解析は,以前に使用された成長条件,期待される平滑度または有界分散仮定よりも厳密に弱い仮定である,期待した残差条件に依存する。定数,減少および最近提案された確率的Polyakステップサイズを含む異なるステップサイズ選択のためのSGDの収束に対する理論的保証を提供した。さらに,著者らの分析のすべては,任意のサンプリングパラダイムに対して保持され,そのようなように,ミニバッチ化の複雑性に洞察を与え,最適ミニバッチサイズを決定する。最後に,訓練データを補間するモデルに対して,著者らは,著者らの期待した残差条件を分離して,この設定において最先端の結果を与えることができることを示した。【JST・京大機械翻訳】