文献
J-GLOBAL ID:201902240870164407   整理番号:19A1115415

並列wavenetを用いた音声超解像【JST・京大機械翻訳】

Speech Super-Resolution Using Parallel WaveNet
著者 (8件):
資料名:
巻: 2018  号: ISCSLP  ページ: 260-264  発行年: 2018年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
オーディオ超解像は,与えられた低分解能(すなわち低サンプリング速度)オーディオのサンプリングレートを増加させるタスクである。音声超解像のための最も一般的な手法の一つは,再構成信号と高サンプリング速度信号の間の二乗ユークリッド距離を点毎に最小化することである。しかし,そのようなアプローチは,平均問題への回帰のような固有の限界を持っている。本研究では,音声超解像タスクのための新しい自己回帰法を導入した。これはWaveNetを利用して,低分解能信号のログスケールのメルスペクトルによるターゲット高分解能信号の分布をモデル化する。自己回帰ニューラルネットワークとして,WaveNetは,目的関数として負の対数尤度を使用する。それは,ユークリッド距離の代わりに,音声波形のような高度に確率的なプロセスに非常に適している。また,並列WaveNetを訓練し,生成過程をリアルタイムにスピードアップした。実験では,VCTKコーパス上でサンプリング速度を4kHzから16kHzに増加させることにより音声超解像を行った。提案した方法は,対数スペクトル距離(LSD)メトリックの下で,ベースラインの深い残留畳込みニューラルネットワーク(CNN)上で約2dBの改善を達成することができる。Copyright 2019 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  図形・画像処理一般 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る