文献
J-GLOBAL ID:202202281697310205   整理番号:22A1077830

タスク外音響情報を付加したEnd-to-End音声認識モデルの設計

Designing an end-to-end speech recognition model with off-target acoustic information.
著者 (5件):
資料名:
巻: 2022  号: 春季  ページ: ROMBUNNO.2-3Q-2  発行年: 2022年02月23日 
JST資料番号: G0381C  ISSN: 1880-7658  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
・音声認識モデルの言語情報の差替えが可能なDensity Ratio法を用いたドメイン外音響情報付加による音声認識モデルの提案。
・音声認識モデル内部からの音響情報抽出,ドメイン外音声認識モデルの出力確率からのドメイン外言語モデルの出力確率の減算の実行。
・学術講演音声認識モデルによる試験ではBaselineの認識精度を改善できず,他の認識モデルではBaselineに劣ることの確認。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
引用文献 (7件):
  • P. Koehn. Statistical Machine Translation. Cambridge University Press, New York, NY, USA
  • E. McDermott. “A Density Ratio Approach to Language Model Fusion in End-to-End Automatic Speech Recognition,” ASRU2019, pp. 434-441, 2019.
  • S. George, T.Zoltan, B.Daniel, and K.Brian, “ADVANCING RNN TRANSDUCER TECHNOLOGY FOR SPEECH RECOGNITION,” ICASSP, 2021.
  • Z. Gong. “Language Model Augmentation in End-to-End ASR Systems Based on Noisy Channel Model,” Acoustical Society of Japan Spring Annual Meetings, (in Japanese), 2021.
  • D.Mori, K.Ohta, R.Nishimura, A.Ogawa, and N.Kitaoka, “Advanced language model fusion method for encoder-decoder model in Japanese speech recognition” APSIPA2021,2021
もっと見る
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る