抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
アドホックチームワークは,共同訓練を含む事前の協調メカニズムなしでチームマートとの協調に迅速に適応できる自律エージェントを設計する挑戦的な問題である。この分野における先行研究は,エージェントの数が固定されている閉鎖チームに焦点を合わせている。本研究では,事前通知なしに環境を入力し,残すための異なる固定政策を持つエージェントを許すことにより,オープンチームを考察した。この解は,様々なチーム構成の下でエージェントモデルと共同行動価値モデルを学習するためにグラフニューラルネットワーク上に構築する。エージェントモデルと共同作用値モデルを統合し,行動値推定を生成する新しい行動値計算に寄与する。このアプローチが,学習者に対する他のエージェントの影響をうまくモデル化することに成功し,動的チーム構成にロバストに適応し,いくつかの代替方法を著しく凌駕する政策を導いた。【JST・京大機械翻訳】