文献
J-GLOBAL ID:201602263199589470   整理番号:16A1376292

統計的パラメトリック音声合成用の変調スペクトルを修正するポストフィルタ

Postfilters to Modify the Modulation Spectrum for Statistical Parametric Speech Synthesis
著者 (6件):
資料名:
巻: 24  号:ページ: 755-767  発行年: 2016年 
JST資料番号: W0508B  ISSN: 2329-9290  CODEN: ITASFA  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
高品質の統計的パラメトリック音声合成用に,テキスト・ツー・スピーチ(TTS)や発声変換(VC)を初めとする,変調スペクトル(MS)に基づく方法を紹介した。統計的パラメトリック音声合成は,波形接続型音声合成よりも色々な利点があるが,品質はまだ波形接続型音声合成や自然音声の品質ほど良くない。品質低下を起こす最大の問題の一つは,生成されたパラメータ軌跡にしばしば認められる過剰平滑化の影響である。全体的変動(GV)は,過剰平滑化とよく相関した特徴として知られており,生成された音声パラメータ軌跡のGVを,自然音声のパラメータ軌跡に似たGVに保つことに効果があることが確認されている。しかしながら,自然音声と合成音声間の品質ギャップはまだ大きい。本論文では,生成された音声パラメータ軌跡のMSを,過剰平滑化効果を定量化する特徴として使うことを提案した。更に,MSを発話ごとに又はセグメントごとに修正して,合成音声のMSを自然音声のMSに近付けるポストフィルタを提案した。提案したポストフィルタは,統計的パラメトリック音声合成に基づく種々の合成器に適用できる。まず,隠れMarkovモデル(HMM)に基づくTTSの枠組みで提案方法を評価し,性能を色々な観点から調べ,更に,GMMに基づくVC,分類と再帰ツリー(CART)に基づくTTS-別名CLUSTERGEN-でも評価した。実験結果から以下を実証した。1)提案した発話レベル・ポストフィルタは,GVを考慮する従来の生成アルゴリズムと同等の品質を達成し,HMMに基づくTTSにおいてGVに基づく生成アルゴリズムを適用することにより,著しい改良を生む,2)提案したセグメントレベルのポストフィルタは,低遅延合成を達成でき,合成音声品質でも著しい改良を生む,3)またポストフィルタは,HMMに基づくTTSばかりでなく,GMMに基づくVCとCLUSTERGENでも効果的である。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  自然語処理 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る