文献
J-GLOBAL ID:201802213058814283   整理番号:18A0357440

複数話者WaveNetボコーダに関する調査

An investigation of multi-speaker WaveNet vocoder
著者 (5件):
資料名:
巻: 117  号: 393(SP2017 66-84)  ページ: 81-86  発行年: 2018年01月13日 
JST資料番号: S0532B  ISSN: 0913-5685  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本稿では,複数話者WaveNetボコーダに関する調査を行う。我々の先行研究において,単一の話者の発話を用いて学習された話者依存WaveNetボコーダは,位相情報などの時系列構造をモデル化することを可能とし,従来の高品質なSTRAIGHTボコーダを上回る品質を示すことが明らかとなった。しかしながら,話者依存WaveNetボコーダはその高い話者依存性のために,複数の話者の音声など様々な特徴を持つ音声を合成できるとは限らない。柔軟かつ高い自然性を持つ音声の合成を可能とするWaveNetボコーダの実現に向け,補助特徴量の改善,ノイズシェーピングによる聴覚マスキングの導入,及び,複数話者データを用いた学習をWaveNetボコーダに適用し,その有効性を調査する。さらに,学習データ量が合成品質に与える影響の調査も行う。我々は実験的に下記の3点を明らかにする。1)複数話者WaveNetボコーダは,既知話者に対しては話者依存WaveNetボコーダと同等の自然性を示すが,未知話者に対しては自然性が低下する。2)複数話者WaveNetボコーダは,既知話者だけでなく,未知話者に対しても従来の高品質ボコーダSTRAIGHTの自然性を大きく上回る。3)単一話者・複数話者に関わらず,客観評価値は学習データ量に比例して改善する。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
音声処理 
引用文献 (21件):
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る