プレプリント
J-GLOBAL ID:202202218730891113   整理番号:22P0074674

教師付き単耳時間領域音声強調のための損失関数について【JST・京大機械翻訳】

On Loss Functions for Supervised Monaural Time-Domain Speech Enhancement
著者 (4件):
資料名:
発行年: 2019年09月03日  プレプリントサーバーでの情報更新日: 2020年01月30日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
予測とターゲット音声信号間のいくつかの変換領域における平均二乗誤差(MSE)を最小化するために,多くの深層学習ベース音声強調アルゴリズムを設計した。しかし,MSEの最適化は,必ずしも高い音声品質や明瞭度を保証しず,それは多くの音声強調アルゴリズムの究極の目標である。さらに,時間領域深層学習ベース音声強調システムの新しいクラスに対する損失関数の影響についてはほとんど知られていない。一般的な損失関数が深層学習ベース音声強調システムの性能にどのように影響するかを調べた。最初に,受信機が人間の聴覚システムであるならば,知覚的に触発された損失関数が有利であることを示した。さらに,学習速度は適応勾配ベース最適化者に対しても重要な設計パラメータであり,これは一般的に文献において見落とされていることを示した。また,波形マッチング性能メトリックスは,ある状況においてそれらが完全に失敗するので注意して使用しなければならないことを見出した。最後に,スケール不変信号対歪比(SI-SDR)に基づく損失関数が,一般的な音声強調評価メトリックスの範囲で良好な一般的性能を達成し,SI-SDRが音声強調システムの汎用損失関数として良い候補であることを示す。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
音声処理 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る