文献
J-GLOBAL ID:201702257776738515   整理番号:17A1287669

低資源条件下でのi-vector特徴に基づくLSTM再帰神経回路網音声認識システム【JST・京大機械翻訳】

Long short term memory recurrent neural network acoustic models using i-vector for low resource speech recognition
著者 (5件):
資料名:
巻: 34  号:ページ: 392-396  発行年: 2017年 
JST資料番号: C2536A  ISSN: 1001-3695  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 中国 (CHN)  言語: 中国語 (ZH)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
低い資源条件の下では,タグ付き訓練データが少ないので,音声認識システムの性能は理想的ではない。この問題に対して、まず、音響モデルにおいて、長時間の記憶(LSTM)再帰神経回路網を研究し、長い配列に対してモデリングを行うことによって、文脈情報を十分にマイニングし、線形射影層を導入してモデルパラメータを減少させた。次に,特徴空間における話者をモデル化する技術を研究し,話者とチャネル情報を効果的に反映することができるID認証ベクトル(i-vector)を抽出した。最後に,上記の研究を結合して,i-vector特性に基づくLSTM再帰ニューラルネットワークシステムを構築した。OpenKWS 2013標準データセット上で実験を行った結果、この技術は深さニューラルネットワークベースラインシステムより10%のバイトエラー率が低いことが明らかになった。Data from Wanfang. Translated by JST【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
著者キーワード (3件):
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る