抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
臨界期間は,トドラーの脳がスパーツで発達する相である。子供の認知発達を促進するために,適切なガイダンスはこの段階で重要である。しかし,そのような臨界期間がAIエージェントの訓練にも存在するかどうかは明らかではない。ヒトの幼児と同様に,十分にタイムドな誘導とマルチモーダル相互作用がAIエージェントの訓練効率を著しく高める可能性がある。この仮説を検証するために,AIエージェントにおける学習に対する臨界期間の概念を適応し,AIエージェントに対する仮想環境における臨界期間を調べた。強化学習(RL)フレームワークにおいて,臨界期間とToddler誘導学習を定式化した。次に,著者らは,ヒト幼児の学習特性を模倣するために,VECAツールキットによってトドラー様環境を構築した。相互作用の3つの離散レベル:弱体誘導(スパース報酬),中等度メトル誘導(ヘルペ-報酬),およびメトル実証(行動クローニング)を研究した。また,トドラーの視点を完全に反映するために,30,000の実世界画像からなるEAVEデータセットを導入した。AIエージェントに対する臨界期間の影響を,2つの視点から評価した。著者らの実験結果は,1百万と2百万の訓練ステップに関する適度なメトル指導と臨界期間を有する単一とマルチモーダルエージェントの両方が,顕著な改良を示すことを示した。EAVEデータセット上での転送学習によりこれらの結果を検証し,同じ臨界期間と誘導に関する性能進歩を見出した。【JST・京大機械翻訳】