神経顔認識のためのGANの潜在空間における方向の発見【JST・京大機械翻訳】

Bounareli Stella; Argyriou Vasileios; Tzimiropoulos Georgios

プレプリント

J-GLOBAL ID：202202213630941804 整理番号：22P0282658

神経顔認識のためのGANの潜在空間における方向の発見【JST・京大機械翻訳】

Finding Directions in GAN's Latent Space for Neural Face Reenactment

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (3件)： , ,
資料名：
発行年： 2022年01月31日プレプリントサーバーでの情報更新日： 2022年10月06日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

本論文は,目標がターゲット顔の顔姿勢(3Dヘッド方向と表現)をソース顔に転送することである。従来手法では,アイデンティティに対する埋込みネットワークを学習し,むしろハードなタスクであることを証明し,生成された画像の品質を劣化させる。高品質顔画像を生成することができる(微調整)事前訓練GANを用いて,そのようなネットワークの訓練を迂回する異なるアプローチを取り上げる。GANは弱い可制御性を特徴とするので,著者らのアプローチのコアは,潜在的GAN空間におけるどの方向が顔姿勢と表情変化を制御するかを発見する方法である。ここでは,顔姿勢,アイデンティティおよび表現に対するもつれた方向を既に捉える3D形状モデルの助けを借りて,そのような方向を学習するための簡単なパイプラインを提示した。さらに,GAN潜在空間に実画像を埋め込むことにより,本手法を実世界顔の再構成にうまく使用できることを示した。提案手法は,単一ソース画像(ワンショット)を用いて,交差個人再制定を可能にするいくつかの好ましい特性を特徴とする。著者らの定性的および定量的結果は,著者らのアプローチが,VoxCeleb1&2の標準ベンチマークのための最先端の手法によって生成されたものより,しばしば有意に高い品質の再構成された顔を生成することを示した。ソースコードは,https://github.com/StelaBou/stylegan_directions_face_reenactmentで利用可能である。【JST・京大機械翻訳】

, , , , , , , ,
, , , , , , 【Automatic Indexing@JST】

パターン認識 , 図形・画像処理一般

, , ,

前のページに戻る