プレプリント
J-GLOBAL ID:202202206472170220   整理番号:22P0305823

マルチモーダル機械翻訳における視覚特徴について【JST・京大機械翻訳】

On Vision Features in Multimodal Machine Translation
著者 (7件):
資料名:
発行年: 2022年03月17日  プレプリントサーバーでの情報更新日: 2022年03月17日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
多モード機械翻訳(MMT)に関する以前の研究は,視覚特徴を翻訳に組み込む方法に焦点を当ててきたが,視覚モデルの品質にはほとんど注意が払われていない。本研究では,MMTに対する視覚モデルの影響を調べた。変換器がコンピュータビジョンで普及しているという事実を考えると,著者らは,様々な強いモデル(例えば,視覚変換機)と強化特性(物体検出と画像キャプティングのような)で実験する。MMTにおける画像のパッチレベル寄与を研究するための選択的注意モデルを開発した。詳細なプロービングタスクにおいて,著者らは,より強い視覚モデルが視覚モダリティからの翻訳の学習に役立つことを見出した。結果はまた,特に現在のベンチマークが小規模で偏ったとき,MMTモデルを注意深く調べる必要性を示唆した。著者らのコードは,ウルル{https://github.com/libeineu/fairseq_mmt}で見つけることができた。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  図形・画像処理一般 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る