プレプリント
J-GLOBAL ID:202202212099741181   整理番号:22P0023028

DFA-NeRF:非もつれ顔属性ニューラルレンダリングによる個人化話頭生成【JST・京大機械翻訳】

DFA-NeRF: Personalized Talking Head Generation via Disentangled Face Attributes Neural Rendering
著者 (5件):
資料名:
発行年: 2022年01月03日  プレプリントサーバーでの情報更新日: 2022年01月03日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
深層ニューラルネットワークの最近の進歩は,高品質画像をレンダリングすることを可能にしたが,光現実的で個人化された会話ヘッドを生成することは困難なままである。与えられたオーディオにより,このタスクに取り組む鍵は,口唇運動を同期させ,同時に頭部運動や眼瞬のような個人化属性を生成することである。本研究では,入力オーディオは口唇運動と高度に相関するが,他の個人化属性(例えば頭部運動)とは相関しないことを観察した。これに触発されて,著者らは,高忠実度と個別化会話ヘッド生成を追求するために,神経放射輝度場に基づく新しいフレームワークを提案した。特に,神経放射輝度場は,口唇運動の特徴と個人化属性を2つのもつれ条件として,口唇運動をオーディオ入力から直接予測し,口唇同期生成を達成した。一方,個人化属性を確率モデルからサンプリングし,ここでは,Gauss過程からサンプリングした変換器ベース変分自動符号化器を設計し,妥当で自然な頭部姿勢と眼瞬目を学習した。いくつかのベンチマークに関する実験は,著者らの方法が最先端の方法より著しく良い結果を達成することを示した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る