Toddler-Guidance学習:マルチモーダルAIエージェントに対する臨界期間の影響【JST・京大機械翻訳】

Park Junseok; Park Kwanyoung; Oh Hyunseok; Lee Ganghun; Lee Minsu; Lee Youngki; Zhang Byoung-Tak

プレプリント

J-GLOBAL ID：202202208830930625 整理番号：22P0027227

Toddler-Guidance学習:マルチモーダルAIエージェントに対する臨界期間の影響【JST・京大機械翻訳】

Toddler-Guidance Learning: Impacts of Critical Period on Multimodal AI Agents

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (7件)： , , , , , ,
資料名：
発行年： 2022年01月12日プレプリントサーバーでの情報更新日： 2022年01月12日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。

臨界期間は,トドラーの脳がスパーツで発達する相である。子供の認知発達を促進するために,適切なガイダンスはこの段階で重要である。しかし,そのような臨界期間がAIエージェントの訓練にも存在するかどうかは明らかではない。ヒトの幼児と同様に,十分にタイムドな誘導とマルチモーダル相互作用がAIエージェントの訓練効率を著しく高める可能性がある。この仮説を検証するために,AIエージェントにおける学習に対する臨界期間の概念を適応し,AIエージェントに対する仮想環境における臨界期間を調べた。強化学習(RL)フレームワークにおいて,臨界期間とToddler誘導学習を定式化した。次に,著者らは,ヒト幼児の学習特性を模倣するために,VECAツールキットによってトドラー様環境を構築した。相互作用の3つの離散レベル:弱体誘導(スパース報酬),中等度メトル誘導(ヘルペ-報酬),およびメトル実証(行動クローニング)を研究した。また,トドラーの視点を完全に反映するために,30,000の実世界画像からなるEAVEデータセットを導入した。AIエージェントに対する臨界期間の影響を,2つの視点から評価した。著者らの実験結果は,1百万と2百万の訓練ステップに関する適度なメトル指導と臨界期間を有する単一とマルチモーダルエージェントの両方が,顕著な改良を示すことを示した。EAVEデータセット上での転送学習によりこれらの結果を検証し,同じ臨界期間と誘導に関する性能進歩を見出した。【JST・京大機械翻訳】

, , , , , , , , , , ,
, , , , 【Automatic Indexing@JST】

人工知能 , 応用心理学

, , , ,

前のページに戻る