文献
J-GLOBAL ID:202002270510143227   整理番号:20A0658153

EMAデータからの多人数話者音声合成

Multi-Speaker Speech Synthesis from EMA Data
著者 (2件):
資料名:
巻: 119  号: 398(SP2019 44-49)(Web)  ページ: 7-12 (WEB ONLY)  発行年: 2020年01月21日 
JST資料番号: S0532B  ISSN: 0913-5685  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本報告では多人数話者を対象に調音運動データの一種であるEMA(electromagnetic articuloguraphy)データからメルケプストラムを推定する方法を提案する.多人数話者のメルケプストラム推定には話者情報が必須である.本システムではEMAデータから生成されたd-vectorを話者情報として利用した.実験の結果,話者クローズテストにおいてd-vectorがメルケプストラムの推定に効果的であることが示された.続いて,メルケプストラム推定器に与えるデータが話者非依存であることの有効性を検証するために,第1ステージにおいてEMAデータを話者非依存なものに変換し,第2ステージのメルケプストラム推定器に与える2ステージネットワークを検討した.話者非依存なデータとしては,全話者のEMAデータのトライフォンレベルの平均を用いた.実験を行ったところ,話者クローズテストでは良好な結果が得られた.また,第2ステージのネットワークに直接トライフォンレベルの平均データを入力した場合には話者オープン/話者クローズの双方で良好な結果が得られたことから,メルケプストラム推定には話者非依存性が重要であることが確認できた.(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
音声処理 
引用文献 (30件):
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る