抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
このレターは,雑音成分を適応的に検出し,時間領域でターゲット音声セグメントを保存するように設計した新しいブラインド音響マスク(BAM)を提案する。ロバスト標準偏差推定器を非定常雑音音声に適用してノイズマスキング要素を同定した。提案した解決策の主な貢献は,低雑音割合のサンプルを定義し選択するための適応情報を導出するために,この雑音統計の使用である。したがって,音声可理解性を保存する。さらに,ターゲット音声と雑音信号統計の情報は,この非理想マスクに対して以前に必要でない。3つの非定常音響雑音と6つの信号対雑音比(SNR)によって崩壊した音声信号を考慮して,BAMと3つの競合方法,理想的バイナリMask(IBM),ターゲットバイナリMask(TBM),およびSpeech強化のための非定常雑音推定(NNESE)を評価した。結果は,良好な音声品質を維持しながら,BAM技術が理想的なマスクに匹敵する可理解性利得を達成することを実証した。【JST・京大機械翻訳】