抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
人工知能の長期的目標は,自然言語を通して通信したエージェントを実行することである。多くの場合,コマンドは,コマンドとエージェントを与える人間によって共有される視覚環境において接地される。コマンドの除外は,次に,適切な行動を取り入れることができる後に,物理的視覚空間にコマンドをマッピングすることを必要とする。本論文では,前者を考察した。より具体的には,自律運転設定における問題を考察し,そこでは,乗客が街路場面で見出されるオブジェクトと関連する行動を要求している。本研究は,自己駆動車のための自然言語で書かれたコマンドを含む最初のオブジェクト紹介データセットであるTalk2Carデータセットを提示した。著者らは,ReferIt,RefCOCO+,RefCOCOg,都市景観-RefおよびCLEVR-Refのような関連データセットとの詳細な比較を提供した。さらに,著者らは,強力な最先端モデルを使用した性能解析を含む。結果は,提案したオブジェクト紹介タスクが,モデルが有望な結果を示しているが,自然言語処理,コンピュータビジョン,およびこれらの分野の交差点における追加研究を必要とする,挑戦的なものであることを示した。データセットは,著者らのウェブサイトに関して見つけることができた。【JST・京大機械翻訳】