文献
J-GLOBAL ID:201702274059816797   整理番号:17A0540425

調波構造に基づくDeep Auto Encoderを用いた残響下音声強調

Reverberant speech enhancement with deep auto encoder based on harmonic structure
著者 (5件):
資料名:
巻: 116  号: 477(SP2016 77-141)  ページ: 141-146  発行年: 2017年02月22日 
JST資料番号: S0532B  ISSN: 0913-5685  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本稿では,調波構造に基づくDeep Auto Encoder(DAE)を用いた残響下音声強調手法について述べる。DAEとは回帰タスクのためのDeep Neural Network(DNN)のことである。最近,対数パワースペクトルを特徴量とし,残響が重畳された音声からクリーン音声を復元するDAEが検討されている。しかしながら,残響構造の複雑さゆえにモデルの最適化が困難となり,強調音声のスペクトル(特に調波構造)が十分に復元されない問題がある。そこで本稿では,残響音声から抽出した調波構造によりDAEの入力特徴量を拡張することで残響下音声強調の性能向上を目指す。また,調波構造を正確に抽出するため,連続スペクトル減算により残響に頑健なF0推定を検討する。最後に,提案手法の有効性を確認するため客観評価実験を実施した。客観評価実験では,調波構造の抽出精度を評価した後,強調音声の音声品質をPESQによって評価した。実験の結果より,入力特徴量に調波構造を追加することでPESQスコアが改善し,高い音声品質を保持できることを確認した。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
音声処理 
引用文献 (12件):
もっと見る
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る