文献
J-GLOBAL ID:202102272681754812   整理番号:21A3307572

最大不一致競合による画像捕獲の再検討【JST・京大機械翻訳】

Revisiting image captioning via maximum discrepancy competition
著者 (6件):
資料名:
巻: 122  ページ: Null  発行年: 2022年 
JST資料番号: D0611A  ISSN: 0031-3203  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
画像キャプティングは,過去数十年の間,コンピュータビジョンと自然言語処理を橋渡しする最新の研究題目である。それは大規模なデータセットと深い学習技術の助けを借りて大きな進歩を達成した。画像キャプティングモデル(ICM)の多様性は,ICMの性能は,公開された結果から判断されたボトルネックにおいて, stみ出されてきた。最近のICMによってもたらされる限界性能利得を考慮して,著者らは以下の疑問を提起した:最近のICMの性能について,インザイス画像で達成される。この問題を明らかにするために,一般化能力を評価することにより既存のICMを比較した。特に,既存のICMを診断するための最大不一致競争に基づく新しい方法を提案し,任意の大規模生画像集合から,既存のICM上で最大不一致競合を採用することによって選択された情報画像のみを含む新しいテストセットを確立した。第2に,小規模で低コストの主観的アノテーション実験を,新しい試験セットに関して実施した。第3に,著者らは,新しいテストセットに関してそれらの性能を比較することによって,既存のICMの一般化能力をランク付けして,種々のICMのキーを実験結果の詳細な解析に基づいて実証した。本解析は,1)同時低および高レベルオブジェクト特徴を用いることが,変換器ベースのICMの一般化能力を高めるための効果的なツールであるかもしれないことを含むいくつかの興味深い知見をもたらした。2)自己注意機構は,他の注意ベース機構よりも,中間およびモード間データに対するより良いモデリング能力を提供する可能性がある。3)多段言語復号器によるICMの構築は,その性能を改善する有望な方法である。Copyright 2021 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  図形・画像処理一般 
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る