抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
自己教師つき学習による視覚表現の学習コンピュータビジョンにおいて普及してきた。ラベルを得ることないアイデアは補助作業を設計することである。これらの課題の大部分は最終的に認識のための有用な不変性の特定の種類を学習するためのデータを提供する。本論文では,(i)間例えば変動(同じクラスの二物体は類似した構造を持つべきである)および(ii)例えば変化(視点,姿勢,変形,照明など)に対して不変表現を学習するために異なる自己教師つきアプローチを利用することを提案した。マルチタスク学習を用いた二つの手法を統合することの代わりに,ここでは,複数の変動データを組織化し,推論に論じた。特に,千ビデオの百からマイニングされたオブジェクトの百万を持つグラフを生成することを提案した。対象は二種類の不変性のに対応するエッジの二種類:「異なる例同様の視点とカテゴリーが」と「同じインスタンスの異なる視点」により連結されている。これらエッジを持つグラフ上の単純な推移を適用することにより,豊富な視覚不変性を示す画像の対を得ることができる。ベースアーキテクチャとしてVGG16による三重項シャムネットワークを訓練し,異なる認識タスクを学習表現を適用するこのデータを用いた。物体検出のために,筆者らは高速R CNN(ImageNetトレーニング前の67.3%と比較して)を用いてPASCAL VOC2007 63.2%mAPを達成した。困難なCOCOデータセットに対して,この方法は,高速R CNNフレームワークを用いたImageNet教師つき対応物(24.4%)に驚くほど近い(23.5%)。も著者らのネットワークが表面法線推定タスクにおけるImageNetネットワークよりも有意に良好な性能を有することを示した。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】