生成敵対ネットワークと顔ランドマーク検出による細粒画像分類に向けて【JST・京大機械翻訳】

Darvish Mahdi; Pouramini Mahsa; Bahador Hamid

文献

J-GLOBAL ID：202202271749256516 整理番号：22A0980025

生成敵対ネットワークと顔ランドマーク検出による細粒画像分類に向けて【JST・京大機械翻訳】

Towards Fine-grained Image Classification with Generative Adversarial Networks and Facial Landmark Detection

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=22A0980025&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=22A0980025&from=J-GLOBAL&jstjournalNo=W2441A") }}

著者 (3件)： , ,
資料名：
巻： 2022 号： MVIP ページ： 1-6 発行年： 2022年
JST資料番号： W2441A 資料種別：会議録 (C)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

識別カテゴリーが学習複雑で局所的差異を必要とするので,細粒分類は挑戦的なタスクである。画像における物体の姿勢,スケール,および位置における多様性は,問題をさらに困難にする。最近のVision変換機モデルは高性能を達成するが,それらは大量の入力データを必要とする。この問題に遭遇するために,GANベースのデータ増強の最良の利用を,余分なデータセットインスタンスを生成するために行った。Oxford-IIIT Petsはこの実験に対する選択のデータセットであった。それは,スケール,姿勢,および照明における変異を有するネコとイヌの37の品種から成り,分類タスクの困難さを強化する。さらに,訓練セットへの過剰適合を防止する一方で,より現実的な画像を生成するため,最近のGenerative Adversarial Network(GAN),StyleGAN2-ADAモデルの性能を強化した。著者らは,動物顔面ランドマークを予測するために,MobileNetV2のカスタマイズバージョンを訓練することによって,これを行った。次に,著者らは,それに応じて画像を作った。最後に,オリジナルデータセットと合成画像を結合して,標準GANs増強と著者らの提案した方法を比較し,訓練データの異なるサブセットによる増強を行わなかった。筆者達は,最近のビジョン変換機(ViT)モデルに関する細粒画像分類の精度を評価することによって,著者らの研究を検証した。コードは,https://github.com/mahdi-darvish/GAN-augmented-pet-classiflerで利用可能である。Copyright 2022 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】

, , , ,
, , , , 【Automatic Indexing@JST】

図形・画像処理一般

, , , ,

前のページに戻る