文献
J-GLOBAL ID:201802223541149120   整理番号:18A0357441

WaveNetボコーダを用いた統計的音声変換法

Statistical voice conversion with WaveNet vocoder
著者 (4件):
資料名:
巻: 117  号: 393(SP2017 66-84)  ページ: 87-92  発行年: 2018年01月13日 
JST資料番号: S0532B  ISSN: 0913-5685  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本稿では,WaveNetボコーダを用いた声質変換を提案する。混合正規分布モデルに基づく声質変換は,入力話者の話者性を目標話者の話者性へと変換する事が可能である。一方で,従来のボコーダを用いた音声波形生成では,F0推定誤差,スペクトル包絡のモデル化誤差,変換特徴量系列の平滑化などにより音声波形のモデル化誤差が生じ,変換音声の音質が著しく低下する事が確認されている。この問題を解決するために,我々は,WaveNetボコーダに基づく音声波形生成法を声質変換に適用する。入力話者の音響特徴量系列は,従来法と同様,混合正規分布モデルに基づき,目標話者の音響特徴量系列へと変換される。変換音響特徴量系列を補助特徴量として用いる事で,WaveNetボコーダは変換音声の音声波形を生成する。本稿では,学習および音声波形生成時にWaveNetボコーダの補助特徴量となる音響特徴量系列に対して幾つかの試みを実施し,WaveNetボコーダを用いた声質変換の有効性を調査する。客観評価実験および主観評価実験より,WaveNetボコーダを用いた声質変換は,従来のボコーダに基づく音声波形生成を利用した声質変換に比べて,高い音質及び話者性変換を実現可能である事がわかった。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
音声処理 
引用文献 (33件):
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る