低資源条件下でのi-vector特徴に基づくLSTM再帰神経回路網音声認識システム【JST・京大機械翻訳】

Huang Guangxu; Tian Yao; Kang Jian; Liu Jia; Xia Shanhong

文献

J-GLOBAL ID：201702257776738515 整理番号：17A1287669

低資源条件下でのi-vector特徴に基づくLSTM再帰神経回路網音声認識システム【JST・京大機械翻訳】

Long short term memory recurrent neural network acoustic models using i-vector for low resource speech recognition

出版者サイト複写サービスで全文入手
高度な検索・分析はJDreamⅢで

著者 (5件)： , , , ,
資料名：
巻： 34 号： 2 ページ： 392-396 発行年： 2017年
JST資料番号： C2536A ISSN： 1001-3695 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：中国 (CHN) 言語：中国語 (ZH)

低い資源条件の下では,タグ付き訓練データが少ないので,音声認識システムの性能は理想的ではない。この問題に対して、まず、音響モデルにおいて、長時間の記憶(LSTM)再帰神経回路網を研究し、長い配列に対してモデリングを行うことによって、文脈情報を十分にマイニングし、線形射影層を導入してモデルパラメータを減少させた。次に,特徴空間における話者をモデル化する技術を研究し,話者とチャネル情報を効果的に反映することができるID認証ベクトル(i-vector)を抽出した。最後に,上記の研究を結合して,i-vector特性に基づくLSTM再帰ニューラルネットワークシステムを構築した。OpenKWS 2013標準データセット上で実験を行った結果、この技術は深さニューラルネットワークベースラインシステムより10%のバイトエラー率が低いことが明らかになった。Data from Wanfang. Translated by JST【JST・京大機械翻訳】

, , , , , , ,
, , , , , , , 【Automatic Indexing@JST】

著者キーワード (3件)： , ,

パターン認識

, , ,

前のページに戻る