文献
J-GLOBAL ID:201702282616748332   整理番号:17A0662569

ディープニューラルネットワークに基づく音声残響除去への残響時間を意識したアプローチ【Powered by NICT】

A Reverberation-Time-Aware Approach to Speech Dereverberation Based on Deep Neural Networks
著者 (4件):
資料名:
巻: 25  号:ページ: 98-107  発行年: 2017年 
JST資料番号: W0508B  ISSN: 2329-9290  CODEN: ITASFA  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
残響時間の広い範囲を処理するために提案した残響時間を意識した深層ニューラルネットワーク(DNN)ベース音声残響除去フレームワーク。ロバストシステムの設計における三つの重要な段階である。最初に,シグモイド活性化とmin-max正規化最新のアルゴリズムとは対照的に,標的特徴の出力層と地球平均分散正規化での線形活性化関数を無響音声残響からの複雑な非線形写像関数を学習し,低周波数と中間周波数含有量の回復を改善するために採用した。次に,二つの重要な設計パラメータ,すなわち,DNN入力における音声フレーミングと音響文脈窓幅におけるフレームシフトの大きさは,多様な残響環境におけるシステム性能を最適化するためにRT60依存パラメータはDNN訓練段階で必要であることを示すために調べた。最後に,音声残響除去のための訓練されたDNN特徴バンドログパワースペクトルに燃料供給する前に残響時間は特徴抽出のための適切なフレームシフトと文脈ウィンドウサイズを選択するために推定した。著者らの実験結果は,提案したフレームワークは,残響時間を考慮せずに従来のDNNより優れていることを示し,極めて弱く,重篤な残響条件でも知られている残響時間を持つオラクル例よりわずかに悪い性能を達成した。も見えない室サイズ,ラウドスピーカとマイクロフォンの位置に一般化し,室内インパルス応答を記録した。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  パターン認識 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る