プレプリント
J-GLOBAL ID:202202211423940820   整理番号:22P0291538

言語仕様による視覚的注意の案内について【JST・京大機械翻訳】

On Guiding Visual Attention with Language Specification
著者 (6件):
資料名:
発行年: 2022年02月17日  プレプリントサーバーでの情報更新日: 2022年02月17日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
実世界の課題は言語単語やフレーズで視覚的カテゴリーを典型的に定義するが,ほとんどの視覚分類法は数値指数を持つカテゴリーを定義する。しかしながら,クラスの言語仕様は,特に,バイアスおよび雑音のあるデータセットに対して,特に有用であり,そこでは,どの特徴がタスク関連であるかを解消するのを助けることができる。最近,大規模マルチモーダルモデルは,追加の画像訓練データなしでも言語仕様から多様な高レベル概念を認識することが示されているが,それらはしばしばより細かいタスクのためにクラスを識別することができない。対照的に,CNNは,細粒識別に必要な微妙な画像特徴を抽出できるが,データセットにおける任意のバイアスや雑音に過剰に適合する。この洞察は,ディストラクタの代わりにタスク関連特徴に対する分類証拠を制約するためのアドバイスとして高レベル言語仕様を用いることである。これを行うために,事前訓練された大規模モデルから注意マップを持つタスク関連単語またはフレーズを地上に置く。次に,この接地を用いて,分散コンテキストから離れて分類器の空間注意を監督した。この方法における空間的注意の監督は,バイアスおよび雑音のあるデータによる分類タスクに関する性能を改善し,公平性メトリックに関する約3~15%の最悪グループ精度改善および41~45%の相対的改善を含むことを示した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  人工知能 
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る