文献
J-GLOBAL ID:202202234849447170   整理番号:22A0155328

Accentron:ゼロショット学習を用いた任意非ネイティブ話者への外国アクセント変換【JST・京大機械翻訳】

Accentron: Foreign accent conversion to arbitrary non-native speakers using zero-shot learning
著者 (3件):
資料名:
巻: 72  ページ: Null  発行年: 2022年 
JST資料番号: T0677A  ISSN: 0885-2308  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: イギリス (GBR)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
外国アクセント変換(FAC)は,与えられた第2言語(L2)話者の音声同一性を持つが,ネイティブ(L1)アクセントを持つ新しい音声を生成することを目的とする。従来のFAC手法は,通常,各L2話者に対する別々のモデルを訓練し,より重要なことに,訓練のために各L2話者からかなりの音声データを必要とする。これらの限界に取り組むために,訓練中に任意のL2話者に対するアクセント変換音声を生成することができるアプローチであるAccentronを提案する。提案アプローチでは,発話の言語内容を表すボトルネック特徴を抽出するために,L1コーパス上で話者独立音響モデルを訓練する。次に,所望の音声アイデンティティ(L2話者)とアクセント(L1アクセント)のための埋込みベクトルを生成するために,話者符号器とアクセントエンコーダを開発した。最後に,L2話者埋込みとL1アクセント埋込みに条件付けされたMel-スペクトログラムにボトルネック特徴を変換するためにシーケンスツーシーケンスモデルを使用した。2つの試験条件の下でL2-ARCTICコーパスに関する実験を行った:試験L2話者が訓練中に見られた標準FAC設定,および試験L2話者が訓練中に不調であるゼロショットFAC設定。標準FAC設定において,2つの最先端のFACシステムと比較して,アクセントネス評価における27%以上の相対的改善を達成した。さらに重要なことに,著者らの結果は,Accentronが性能損失なしにゼロショットFAC設定に一般化することを示した。したがって,実際の使用シナリオ(例えば,計算機支援発音訓練ソフトウェア)において,Accentronは,このモデルを適応または再訓練する必要性を効果的に避けることができ,そしてそれは,計算およびユーザの待ち時間を著しく減らした。Copyright 2022 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  人工知能  ,  システム・制御理論一般 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る