プレプリント
J-GLOBAL ID:202202220562982722   整理番号:22P0328311

音声認識のための復号器効率を改善するためのコンフォーマへのコネクショニスト時間要約の追加【JST・京大機械翻訳】

Adding Connectionist Temporal Summarization into Conformer to Improve Its Decoder Efficiency For Speech Recognition
著者 (4件):
資料名:
発行年: 2022年04月08日  プレプリントサーバーでの情報更新日: 2022年04月08日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
コンフォーマーモデルは,接続主義時間分類(CTC)のハイブリッド損失を効果的に利用し,訓練モデルパラメータに注意する音声認識モデリングのための優れたアーキテクチャである。コンフォーマの復号化効率を改善するために,符号器により生成された音響シーケンスから供給される注意復号器に必要なフレームの数を低減する新しい接続主義時間要約(CTS)法を提案した。しかしながら,そのような復号化改善を達成するためには,交差注意観測が変化し,従って対応する精密化を必要とするので,モデルパラメータを微調整しなければならない。著者らの最終実験は,4のビーム幅で,LibriSpeechの復号化予算が20%まで低減でき,FluentSpeechデータに対して,ASR精度を失うことなく11%まで低減できることを示した。精度の向上は,LibriSpeech”テスト-他の”セットでも見られた。単語誤り率(WER)は,ビーム幅1で6%,ビーム幅4で3%減少した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る