文献
J-GLOBAL ID:202102254927633318   整理番号:21A0152000

Tacotron(End-to-End生成モデル)に基づくミャンマー語テキスト-音声システム【JST・京大機械翻訳】

Myanmar Text-to-Speech System based on Tacotron (End-to-End Generative Model)
著者 (3件):
資料名:
巻: 2020  号: ICTC  ページ: 572-577  発行年: 2020年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文の主な動機は,タコトロンと呼ばれるエンドツーエンド生成モデルを用いて,Myanmarテキスト対音声システムの自然性を改善することである。非常に高い自然音を有するMyanmarテキスト対音声システムに対するオープンソース実装を紹介した。本論文では,音声コーパス生成,データ前処理,エンドツーエンド生成モデルの適用,および音声合成の4つの主な部分がある。第1に,著者らは,コーパス作成のために,新しい書籍,毎日の利用および旅行関連表現の大規模集合から8k文章の音声コーパスを開発した。第二に,データ前処理のために音節分割器とテキスト正規化器を使用する。第三に,テキスト文字列から直接音声を合成するタコトロンと呼ばれるエンドツーエンド生成モデルを適用した。最後に,Grifin-Limアルゴリズムを用いて,対応するテキストを出力音声に変換した。主観的評価のため,平均意見スコア(MOS)を用いて,明瞭度および自然性の両者における元の記録音声と合成音声出力を比較した。実験結果は,他の言語に対して類似の最先端の合成者に匹敵する合成音声を得ることができることを示した。Copyright 2021 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る