抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本報告ではDNN音声合成におけるスタイル付与手法について検討している.スタイル付与とは,音声を合成したい話者(目標話者)のモデル学習用音声として読上げ音声のみが与えられた場合に,その話者の表現豊かな音声を合成する技術である.本報告では目標話者の読上げ音声が少量しか与えられていない状況を想定し,i-vectorをDNNの入力として用いる二つのモデルについて評価検討している.提案手法の基本的な枠組みは従来手法と同様,複数話者の多様な表現を持つ音声を用いて話者性とスタイルを制御可能なモデルを構築することであり,提案法ではi-vectorを合成音声の話者性を制御するためのDNNの入力として用いている.提案モデルの効果を確認するため客観及び主観評価実験を行い,提案スタイル付与手法とone-hot表現の話者コードをDNNの入力として用いる従来モデルとの比較評価結果を示す.(著者抄録)