文献
J-GLOBAL ID:201802263028327366   整理番号:18A0440120

完全畳込みネットワークによる生波形ベース音声強調【Powered by NICT】

Raw waveform-based speech enhancement by fully convolutional networks
著者 (4件):
資料名:
巻: 2017  号: APSIPA ASC  ページ: 006-012  発行年: 2017年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本研究は,生波形に基づく音声強調のための完全に畳込みネットワーク(FCN)モデルを提案した。提案したシステムは,エンドツーエンド(すなわち,波形と波形)依存的に音声強調,スペクトル(例えば,対数パワースペクトル(LPS))だけを処理した多くの既存の雑音除去手法とは異なるを行う。深層ニューラルネットワーク(DNN)と畳込みニューラルネットワーク(CNN)に関与する,完全に結合した層は,音声信号の局所情報,特に高周波成分を正確に特性化しない可能性があるので,著者らは完全に畳込み層を採用した波形をモデル化した。より具体的には,FCNは畳込み層から構成され,このようにして音声信号の局所時間的構造は比較的少ない量で保存した効率的かつ効果的にすることができた。実験結果は,DNNおよびCNNに基づくモデルは,波形の高周波成分を回復,強調音声の了解度を低下させることに限られた能力を持っていることを示した。これとは対照的に,提案したFCNモデルは効果的に波形を回復するが,また短時間客観的了解度(STOI)および音声品質の知覚評価(PESQ)の観点からLPS DNNベースラインよりも優れていることができる。添加では,FCNのモデルパラメータの数は約両方DNNとCNNのそれと比較したわずか0.2%であった。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  ニューロコンピュータ 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る