文献
J-GLOBAL ID:201902229532571521   整理番号:19A1120748

一見における口唇運動の生成【JST・京大機械翻訳】

Lip Movements Generation at a Glance
著者 (5件):
資料名:
巻: 11211  ページ: 538-553  発行年: 2018年 
JST資料番号: H0078D  ISSN: 0302-9743  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: ドイツ (DEU)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,任意の音声と任意のターゲットアイデンティティの一つの口唇画像を与えて,音声を共有するターゲットアイデンティティの合成された口唇運動を生成する。良く機能するために,モデルは,目標アイデンティティの保持,合成画像の光現実性,シーケンスにおける口唇画像の一貫性と滑らかさを考慮する必要があるだけでなく,より重要なことに,音声と口唇運動の間の相関を学ぶ。集団的問題を解決するために,著者らは口唇運動を合成するためにネットワークを考案し,口唇変化と音声変化を同期させるための新しい相関損失を提案した。完全なモデルは包括的な考察のために4つの損失を利用する。それは,エンドツーエンドで訓練され,口唇形状,視野角および異なる顔特性に対してロバストである。本モデルは,このタスクに拡張された他の最先端の方法よりも著しく優れていることを示した。Copyright 2018 Springer Nature Switzerland AG Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
著者キーワード (2件):
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  パターン認識  ,  自然語処理 
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る