文献
J-GLOBAL ID:201802231526344152   整理番号:18A1682108

並列計算可能なディープニューラルネットワークに基づく音声変換システム【JST・京大機械翻訳】

Voice Conversion System Based on Deep Neural Network Capable of Parallel Computation
著者 (2件):
資料名:
巻: 2018  号: VR  ページ: 677-678  発行年: 2018年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
音声変換(VC)アルゴリズムは特定話者の音声を修正し,他の話者と類似する。多くの既存のバーチャルリアリティ(VR)と拡張現実(AR)システムは,ユーザの外観を変えることを可能にし,VCが追加されると,ユーザはそれらの音声を変えることもできる。最新のVC法は,変換された音声を生成するために,長い短期メモリ(LSTM)ネットワークを含むリカレントニューラルネットワーク(RNNs)を採用する。しかし,各時間ステップでの計算が以前の時間ステップの結果に依存するので,RNNが並列計算を実行するのは困難である。これは実時間での操作からそれらを妨げる。対照的に,並列計算を可能にする深いニューラルネットワークモデルである拡張畳込みニューラルネットワーク(Dilated CNN)に基づく新しいVCアプローチを提案した。学習を確実にするために,順方向と逆方向の両方で畳込みを実行するために,Dilated CNNモデルを適用した。さらに,このモデルを訓練と推論フェーズの両方で並列化できるようにするために,入力音声の値からすべての出力値を予測するモデルアーキテクチャを開発し,次の入力に対する予測値に依存しない。結果は,提案したVCアプローチが,最先端の方法に比べて,より速い変換率を持ち,一方,音声品質を改善し,話者類似性を維持することを実証した。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る