プレプリント
J-GLOBAL ID:202202219156467428   整理番号:22P0026118

強化または無いための学習:重複音声認識のための強化および観測信号のニューラルネットワークベーススイッチング【JST・京大機械翻訳】

Learning to Enhance or Not: Neural Network-Based Switching of Enhanced and Observed Signals for Overlapping Speech Recognition
著者 (6件):
資料名:
発行年: 2022年01月11日  プレプリントサーバーでの情報更新日: 2022年01月11日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
深層ニューラルネットワーク(DNN)ベースの音声強調(SE)フロントエンドと自動音声認識(ASR)バックエンドの組合せは,重複音声認識を実装するための広く使われるアプローチである。しかし,SEフロントエンドはASR性能を劣化できる加工アーチファクトを生成する。以前に,そのような性能劣化は,信号対干渉比(SIR)と信号対雑音比(SNR)に依存して,完全重複条件下でさえ起こることを見出した。劣化を緩和するために,強化と観測信号の間のASR入力を切り替える規則ベースの方法を導入し,有望な結果を示した。しかし,ルールの最適性は,発見的に設計され,SIRとSNR値のみに基づいて,不明瞭であった。本研究では,ASRが増強または観測信号でよりよく機能するかどうかを直接推定するDNNベーススイッチング法を提案した。また,スイッチングモデルの出力後部により与えられた重みを用いて,ASR入力に対する強調信号と観測信号の加重和を計算するソフトスイッチングを導入した。提案した学習ベーススイッチングは,ルールベースオラクルスイッチングに匹敵する性能を示した。ソフトスイッチングはASR性能をさらに改善し,従来法と比較して23%までの相対特性誤り率低減を達成した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  音声処理 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る