文献
J-GLOBAL ID:202102213322350795   整理番号:21A0577793

画像キャプションのためのBERTを用いたテキスト増強【JST・京大機械翻訳】

Text Augmentation Using BERT for Image Captioning
著者 (2件):
資料名:
巻: 10  号: 17  ページ: 5978  発行年: 2020年 
JST資料番号: U7135A  ISSN: 2076-3417  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: スイス (CHE)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
画像キャプティングは,人間による画像記述の根底にあるメカニズムのより深い理解と同様に,人間-コンピュータインタラクションを改善するための重要なタスクである。近年,この研究分野は急速に発展し,多くの印象的な結果が得られた。典型的なモデルは,画像符号化のための畳み込み型ものを含むニューラルネットワークと,それらをテキストに復号化するためのリカレントなものを含む。さらに,注目機構と変圧器は,ブースティング性能に積極的に使用されている。しかし,最良のモデルでさえ,データ不足でそれらの品質に限界がある。異なる状況におけるオブジェクトの多様な記述を生成するために,大きな訓練セットが必要である。画像数に関してかなり大きいが,現在の一般的に使用されるデータセットは,1つの画像当たりの異なるキャップの数に関して極めて小さい。テキスト増強法を用いて訓練データセットを拡張した。方法:ベースラインとしての同義語による増強と,変換者(BERT)からの双方向エンコーダ表現と呼ばれる最先端の言語モデルを含む。その結果,データセット上で訓練されたモデルは,増加のないデータセットで訓練されたモデルよりも良い結果を示した。Copyright 2021 The Author(s) All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 
引用文献 (47件):
  • Staniūtė, R.; Šešok, D. A Systematic Literature Review on Image Captioning. Appl. Sci. 2019, 9, 2024.
  • Zafar, B.; Ashraf, R.; Ali, N.; Iqbal, M.K.; Sajid, M.; Dar, S.H.; Ratyal, N.I. A novel discriminating and relative global spatial image representation with applications in CBIR. Appl. Sci. 2018, 8, 2242.
  • Belalia, A.; Belloulata, K.; Kpalma, K. Region-based image retrieval in the compressed domain using shape-adaptive DCT. Multimed. Tools Appl. 2016, 75, 10175-10199.
  • Rennie, S.J.; Marcheret, E.; Mroueh, Y.; Ross, J.; Goel, V. Self-critical sequence training for image captioning. In Proceedings of the 2017 IEEE Conference on Computer Vision and Pattern Recognition, Honolulu, HI, USA, 21-26 July 2017; pp. 7008-7024.
  • Shuster, K.; Humeau, S.; Hu, H.; Bordes, A.; Weston, J. Engaging image captioning via personality. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, Long Beach, CA, USA, 16-17 June 2019; pp. 12516-12526.
もっと見る
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る