プレプリント
J-GLOBAL ID:202202206888610610   整理番号:22P0304659

正規化フローを用いたテキストフリー非並列多対多音声変換【JST・京大機械翻訳】

Text-free non-parallel many-to-many voice conversion using normalising flows
著者 (7件):
資料名:
発行年: 2022年03月15日  プレプリントサーバーでの情報更新日: 2022年03月15日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
非並列音声変換(VC)は,ソース音声の損失表現を用いて典型的に達成される。しかし,話者アイデンティティ情報のみを確実にするのは,ソース音声からの他のすべての情報が大きな課題となっている一方で,低下する。これは,推論時間,すなわちテキストフリーVCの知識を持たないシナリオにおいて特に困難である。これを緩和するために,情報保存VCアプローチを研究した。正規化フローはテキスト対音声合成に対して注目を得てきたが,VCに対しては探索されていない。フローは,データの尤度を学習するために可逆関数を利用し,従って,音声の無損失符号化を提供する。テキスト条件およびテキストフリーシナリオの両者におけるVCに対する正規化フローを調べた。さらに,テキストフリーVCに対して,事前訓練および共同学習事前処理を比較した。フローベースVC評価は,テキストフリーとテキスト条件VCの間の劣化を示さず,最先端技術の改善をもたらした。また,事前の共同訓練は,テキストフリーVC品質に悪影響を与えることが分かった。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
音声処理 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る