注意機構に基づくエンドツーエンド音声認識アルゴリズム【JST・京大機械翻訳】

Chen Jia-nan; Gao Shuang; Sun Han-zhe; Liu Xiao-hui; Wang Zi-ning; Zheng Yan

文献

J-GLOBAL ID：202002256749593459 整理番号：20A2037208

注意機構に基づくエンドツーエンド音声認識アルゴリズム【JST・京大機械翻訳】

An End-to-end Speech Recognition Algorithm based on Attention Mechanism

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=20A2037208&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=20A2037208&from=J-GLOBAL&jstjournalNo=W2441A") }}

著者 (6件)： , , , , ,
資料名：
巻： 2020 号： CCC ページ： 2935-2940 発行年： 2020年
JST資料番号： W2441A 資料種別：会議録 (C)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

エンドツーエンド音声認識システムは音声認識における主要な研究分野である。最も典型的なモデルは,RNNマイニングと時系列情報を採用するCTCに基づくエンドツーエンド音声認識システムであり,HMMの一連の仮定は,良好な認識率を得るために廃棄される。しかし,CTCベースのモデルは音声モデルに依存し,長い訓練サイクルを持つ。したがって,従来の音響モデルのフレームワークにおいて,本論文は事前知識を用いて注意機構に基づくスペクトログラムの特徴抽出ネットワークを訓練することを提案する。第1に,それはCTCモデルに基づいてフロントエンドでスプライスして,次に,CTCモデルに基づく循環ニューラルネットワークの層数を減らした。最後に,それをリトレインした。実験結果は,複合モデルの訓練時間が効果的に減少して,音声認識の精度をさらに改善することを示した。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】

, , , ,
, , , , , , 【Automatic Indexing@JST】

図形・画像処理一般

, , ,

前のページに戻る