抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
・本研究では,二人零和ゲームにおける突然変異付きレプリケータダイナミクスを利用したオンライン学習アルゴリズムの帰結を吟味。
・突然変異に着想したアルゴリズムMFTRLを提案し,完全情報フィードバック設定と部分的フィードバック設定で3つの手法がどのような振る舞いを学習するかを吟味。
・3つの手法は,正規化リーダへの追従(FTRL),正規化リーダへの最適追従(OFRL),および正規化リーダへの突然変異追従(MFRL)。
・実験の結果,2つの設定でMFTRLのダイナミクスが時間平均を取らずに均衡に収束することを明示。