抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文は,あいまいな要求による人間命令に基づくロボット操作を研究した。意図は,視覚観察を通して不完全な自然言語を補償することである。手動で定義された記号に基づく初期記号的方法は,自然言語要求から行動のシーケンスを作り出すための意味構文解析とタスク計画から成る。現代の接続主義法は,視覚と言語の特徴を自動的に学習するために深層ニューラルネットワークを採用し,エンドツーエンド方式で低レベルの動作のシーケンスにマップする。これら2つのアプローチを混合し,ハイブリッド,モジュールフレームワークを創造し,深層ニューラルネットワークによる記号的目標学習に従って命令を定式化し,続いて記号計画者によるタスク計画を行った。接続者と記号モジュールは,計画領域定義言語で架橋される。ビジョンと言語学習ネットワークはその目標表現を予測し,タスク完了行動シーケンスを生成するためにプランナーに送られる。自然言語の柔軟性を改善するために,明示的な人間命令を持つ暗黙の人間意図をさらに組み入れる。視覚と言語のための一般的特徴を学ぶために,著者らは,シーングラフ構文と意味的テキスト類似性タスクに関する視覚と言語エンコーダを別々にプレトレインすることを提案する。ベンチマーキングは,視覚および言語学習モデルに対する異なる成分あるいはオプションの影響を評価し,予訓練戦略の有効性を示した。シミュレータAI2THORで行った操作実験は,新しいシナリオに対するフレームワークのロバスト性を示した。【JST・京大機械翻訳】