自己管理視覚表現学習のための推移不変性【Powered by NICT】

Wang Xiaolong; He Kaiming; Gupta Abhinav

文献

J-GLOBAL ID：201802244746293911 整理番号：18A0137208

自己管理視覚表現学習のための推移不変性【Powered by NICT】

Transitive Invariance for Self-Supervised Visual Representation Learning

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=18A0137208&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=18A0137208&from=J-GLOBAL&jstjournalNo=W2441A") }}

著者 (3件)： , ,
資料名：
巻： 2017 号： ICCV ページ： 1338-1347 発行年： 2017年
JST資料番号： W2441A 資料種別：会議録 (C)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

自己教師つき学習による視覚表現の学習コンピュータビジョンにおいて普及してきた。ラベルを得ることないアイデアは補助作業を設計することである。これらの課題の大部分は最終的に認識のための有用な不変性の特定の種類を学習するためのデータを提供する。本論文では,(i)間例えば変動(同じクラスの二物体は類似した構造を持つべきである)および(ii)例えば変化(視点,姿勢,変形,照明など)に対して不変表現を学習するために異なる自己教師つきアプローチを利用することを提案した。マルチタスク学習を用いた二つの手法を統合することの代わりに,ここでは,複数の変動データを組織化し,推論に論じた。特に,千ビデオの百からマイニングされたオブジェクトの百万を持つグラフを生成することを提案した。対象は二種類の不変性のに対応するエッジの二種類:「異なる例同様の視点とカテゴリーが」と「同じインスタンスの異なる視点」により連結されている。これらエッジを持つグラフ上の単純な推移を適用することにより,豊富な視覚不変性を示す画像の対を得ることができる。ベースアーキテクチャとしてVGG16による三重項シャムネットワークを訓練し,異なる認識タスクを学習表現を適用するこのデータを用いた。物体検出のために,筆者らは高速R CNN(ImageNetトレーニング前の67.3%と比較して)を用いてPASCAL VOC2007 63.2%mAPを達成した。困難なCOCOデータセットに対して,この方法は,高速R CNNフレームワークを用いたImageNet教師つき対応物(24.4%)に驚くほど近い(23.5%)。も著者らのネットワークが表面法線推定タスクにおけるImageNetネットワークよりも有意に良好な性能を有することを示した。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】

, , , , , , , , , ,
, , , 【Automatic Indexing@JST】

パターン認識 , 人工知能

, , , ,

前のページに戻る