プレプリント
J-GLOBAL ID:202202218073577470   整理番号:22P0327660

制御可能音声合成のための教師なし量子化韻律表現【JST・京大機械翻訳】

Unsupervised Quantized Prosody Representation for Controllable Speech Synthesis
著者 (5件):
資料名:
発行年: 2022年04月07日  プレプリントサーバーでの情報更新日: 2022年04月07日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,教師なし方式における分解韻律表現を得るために,補助韻律符号器にベクトル量子化(VQ)法を導入する韻律テキスト(TTS)モデルのための新しい韻律分割法を提案した。その利点に関して,ピッチ,発話速度,局所ピッチ分散などの発話スタイルを潜在量子化ベクトルに自動的に分解した。また,潜在変数対によるVQ解角過程の内部機構を調べ,より高い値次元が通常韻律情報を表すことを見出した。実験は,著者らのモデルが,潜在変数を直接操作することによって,合成結果の発話スタイルを制御することができることを示した。客観的および主観的評価は,著者らのモデルが一般的なモデルより優れていることを示した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
音声処理 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る