低資源音声認識のためのゲート畳込みネットワークに基づくハイブリッド音響モデル【Powered by NICT】

Kang Jian; Zhang Wei-Qiang; Liu Jia

文献

J-GLOBAL ID：201802271946247518 整理番号：18A0441051

低資源音声認識のためのゲート畳込みネットワークに基づくハイブリッド音響モデル【Powered by NICT】

Gated convolutional networks based hybrid acoustic models for low resource speech recognition

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=18A0441051&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=18A0441051&from=J-GLOBAL&jstjournalNo=W2441A") }}

著者 (3件)： , ,
資料名：
巻： 2017 号： ASRU ページ： 157-164 発行年： 2017年
JST資料番号： W2441A 資料種別：会議録 (C)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

大語い音声認識のための音響モデリングでは,リカレントニューラルネットワーク(RNN)は,時間依存性をモデル化するために大きな能力を示した。しかし,RNNの性能は限られた資源しか持たないタスクにおける顕著ではない,従来のフィードフォワードニューラルネットワーク(FNN)よりも劣っていた。さらに,RNNのための訓練時間はFNNのそれよりもはるかに大きかった。近年,いくつかの新しいモデルを示した。は長期依存性をモデル化するために,非再発アーキテクチャを用いた。これらアーキテクチャでは,ゲート機構を用いた音響モデルを構築するために有効な方法であることを示した。一方,畳込み演算を用いた音響特徴を学習するために優れた方法であることが証明されている。はこれら二つの方法の両方の利点を取ることを期待している。本論文では,低資源音声認識タスクにゲート畳込み手法を提案した。ゲート畳込みネットワークは,入力特徴とゲートを学習制御情報に畳込みアーキテクチャを用いた。実験はOpenKWS,一連の低資源キーワード検索の評価を行った。結果から,ゲート畳込みネットワークは比較的BLSTMモデルよりもWERを減少させるベースラインLSTMモデルより約6%,DNNモデルより5%と3%であった。添加では,新しいモデルがベースラインLSTMとBLSTMモデルのそれと比較して1.8倍および3.2倍以上の学習速度を加速した。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】

, , , , , , , ,
, , , , , , 【Automatic Indexing@JST】

ニューロコンピュータ

, , , ,

前のページに戻る