文献
J-GLOBAL ID:201602202723132257   整理番号:16A0353482

雑音環境下音声認識のためのディープニューラルネットワークを用いた識別的区分線形変換

著者 (4件):
資料名:
巻: J99-D  号:ページ: 255-263 (WEB ONLY)  発行年: 2016年03月01日 
JST資料番号: U0473A  ISSN: 1881-0225  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,ディープニューラルネットワークを用いた区分的線形変換による統計的特徴量強調の拡張を提案する。本提案手法の目的は,雑音環境下音声認識を想定した特徴量領域における雑音除去を目的とし,観測された音声特徴量から対応する静音環境下での音声特徴量の再現を行うことである。その際,ニューラルネットワークを用いて,観測された雑音環境下の音声特徴量より,ガウス混合分布でクラスタリングされた静音環境下における音声特徴量の領域を識別する。その後,各領域に対応する線形変換をニューラルネットワークにより得られる事後確率を重みとして足し合わせることで静音環境下での音声特徴量を推定する。これによって,ニューラルネットワークのもつ高い識別性能と,従来の生成モデルに基づく特徴量マッピング手法のもつ高い汎化性能の融合を狙う。Aurora-2データベースを用いた連続音声認識実験により,提案手法は従来の区分線形変換法の一つであるStereo-based Piecewise LInear Compensation for Environments(SPLICE)と比較して,雑音が既知の条件では53.72%単語誤り率を削減することができた。更に,ニューラルネットワークを回帰モデルとして用いたオートエンコーダと比較した場合,雑音環境が未知な条件で26.96%の単語誤り率の削減が可能となった。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
引用文献 (17件):
もっと見る
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る