文献
J-GLOBAL ID:202002256749593459   整理番号:20A2037208

注意機構に基づくエンドツーエンド音声認識アルゴリズム【JST・京大機械翻訳】

An End-to-end Speech Recognition Algorithm based on Attention Mechanism
著者 (6件):
資料名:
巻: 2020  号: CCC  ページ: 2935-2940  発行年: 2020年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
エンドツーエンド音声認識システムは音声認識における主要な研究分野である。最も典型的なモデルは,RNNマイニングと時系列情報を採用するCTCに基づくエンドツーエンド音声認識システムであり,HMMの一連の仮定は,良好な認識率を得るために廃棄される。しかし,CTCベースのモデルは音声モデルに依存し,長い訓練サイクルを持つ。したがって,従来の音響モデルのフレームワークにおいて,本論文は事前知識を用いて注意機構に基づくスペクトログラムの特徴抽出ネットワークを訓練することを提案する。第1に,それはCTCモデルに基づいてフロントエンドでスプライスして,次に,CTCモデルに基づく循環ニューラルネットワークの層数を減らした。最後に,それをリトレインした。実験結果は,複合モデルの訓練時間が効果的に減少して,音声認識の精度をさらに改善することを示した。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る