文献
J-GLOBAL ID:202102235772797948   整理番号:21A1204808

マルチヘッド注意機構を用いた視覚と言語ナビゲーション【JST・京大機械翻訳】

Vision and Language Navigation using Multi-head Attention Mechanism
著者 (3件):
資料名:
巻: 2020  号: BigDIA  ページ: 74-79  発行年: 2020年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
深層学習の開発の後流において,自然言語処理およびマシンビジョン,ビジョンおよび言語ナビゲーション(VLN)の交差点分野に関するますます多くの研究焦点は,それらの1つである。VLNタスクは,視覚情報の助けを借りて,実際の3D環境の中で自然言語命令とナビゲートを実行するための具体化エージェントを必要とし,開始点から目標位置までの軌道を計画する。本論文では,以前の研究に触発されて,モデルの性能を高めるために,視覚およびテキスト入力にマルチヘッド注意機構を適用する並列注意計算方式を有するマルチヘッド注意モジュールを導入した。具体的には,最初に,テキストと視覚情報から関連する注意を抽出することができる訓練可能なパラメータを有するマルチヘッド注意モジュールを設計し,抽出された注意変数を用いて,文章または画像の一部がより重要であるエージェントを意識した。第2に,エージェントがより有用な情報を知覚するのを助けるために,著者らは,抽出した注意と入力,すなわち視覚とテキスト入力特性に関して並列計算方式を実行して,次にそれらを結合するために層正規化を使用した。実験の結果は,著者らの提案したモジュールが,より良い性能を得て,ベースラインモデルを凌駕するのを可能にすることを示した。著者らのモデルの成功率は51%であり,オラクル成功率は低航法誤差で62%であった。Copyright 2021 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る