プレプリント
J-GLOBAL ID:202202216067724434   整理番号:22P0295767

RNN変換器ASRモデルの訓練と適応のためのテキスト入力の統合【JST・京大機械翻訳】

Integrating Text Inputs For Training and Adapting RNN Transducer ASR Models
著者 (4件):
資料名:
発行年: 2022年02月26日  プレプリントサーバーでの情報更新日: 2022年02月26日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
各コンポーネントが新しいドメインに独立に適応できるモジュールアーキテクチャを使用するハイブリッド自動音声認識(ASR)システムと比較して,最近のエンドツーエンド(E2E)ASRシステムは,それらの全神経モノリシック構築のためにカスタム化することがより困難である。本論文では,E2E ASRモデルのための新しいテキスト表現と訓練フレームワークを提案した。このアプローチにより,訓練されたRNNトランスデューサ(RNN-T)モデルの内部LM成分がテキストのみのデータに効果的に適応できることを示した。音声とテキスト入力の両方を用いて訓練されたRNN-Tモデルは,NIST Hub52000評価のスイッチボードとCallHomeテストセットで,約13%の単語誤り率(WER)削減で,ちょうど音声上で訓練されたベースラインモデルを越えて改善した。この一般的目的RNN-Tモデルを3つの別々のデータセットにカスタマイズすることによって,提案した方法の有用性をさらに実証した。新しいドメインからの不対テキストデータのみを用いて,この新しいLMスタイルカスタム化技法によるこれらの設定における20-45%相対単語誤り率(WER)低減を観測した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 

前のページに戻る