プレプリント
J-GLOBAL ID:202202205882627310   整理番号:22P0194419

シーングラフは画像キャプションの改善に十分か?【JST・京大機械翻訳】

Are scene graphs good enough to improve Image Captioning?
著者 (3件):
資料名:
発行年: 2020年09月25日  プレプリントサーバーでの情報更新日: 2020年10月27日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
多くのトップ形成画像キャプテーションモデルは,画像記述を生成するためにオブジェクト検出モデルで計算したオブジェクト特徴のみに依存する。しかしながら,最近の研究では,オブジェクト間のインタラクションをより良く記述するために,キャプテーションへのオブジェクト関係に関する情報を導入するために,シーングラフを直接使用することを提案する。本研究では,画像キャプテーションにおけるシーングラフの使用を徹底的に調査した。付加的シーングラフ符号器を使用するかどうかは,より良い画像記述に導くことができ,画像キャプティング復号器状態を用いてグラフ更新を条件付けする条件付きグラフ注意ネットワーク(C-GAT)を提案する。最後に,予測シーングラフにおけるどの程度のノイズがキャプション品質に影響するかを決定した。全体として,シーングラフの特徴と,異なるキャプションメトリックスを横断するオブジェクト検出特徴のみを使用するモデルの間に有意差はなく,これは,既存のシーングラフ生成モデルが,画像キャプテーションにおいて有用であるのに,まだ雑音が多いことを示唆する。さらに,予測シーングラフの品質は,一般的に非常に低かったが,高品質シーングラフを用いた場合,強いBottom-Up Top-Downベースラインと比較して,3.3CIDErまでの利得を得た。https://github.com/iacercalixto/butd image captioningにおけるすべての実験を再現するためにソースコードを公開した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  図形・画像処理一般 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る