文献
J-GLOBAL ID:201702290124316319   整理番号:17A1639382

統計的パラメトリック音声合成のための声門活性特徴を用いた改良型音声決定【Powered by NICT】

Improved voicing decision using glottal activity features for statistical parametric speech synthesis
著者 (3件):
資料名:
巻: 71  ページ: 131-143  発行年: 2017年 
JST資料番号: W1600A  ISSN: 1051-2004  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
統計的パラメトリック音声合成のための提案した声門活性特徴を用いた発声決定を改善する方法。既存の方法では,有声音意思決定は基本周波数0,これは予測が不正確であると誤差を生じる可能性があるに依存している。F0は声門活性特徴であるにもかかわらず,この活性を特性化する他の特徴は,有声化意思決定の改善の助けとなる。本研究で用いた声門活性特徴は励起(SoE),正規化自己相関ピーク強度(NAPS),高次統計量(HOS)の強度である。これらの特徴は零周波数フィルタリングされた信号と積分線形予測残差のような近似源信号から得た。有声音意思決定を改善するために,分類のための発見的しきい値を避けるために,声門活性特徴は,k最近傍,サポートベクトルマシン(SVM),および深い信念ネットワークのような種々の統計的学習法を用いて訓練した。有声化意思決定は,SVM分類器を用いて最良の作動し,その有効性を統計的パラメトリック音声合成を用いて試験した。声門活性は有声化意思決定を得るためにSoE,NAPS,HOSは隠れMarkovモデルと深層ニューラルネットワークにおける0とメルケプストラム係数と共にモデル化である。客観的および主観的評価は,提案した方法は,合成音声の自然性を改善することを示す。Copyright 2017 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
音声処理 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る