文献
J-GLOBAL ID:201702256482326080   整理番号:17A0369030

自動音声認識における話者適応への応用による深い神経回路網の移動学習への統一的アプローチ【Powered by NICT】

A unified approach to transfer learning of deep neural networks with applications to speaker adaptation in automatic speech recognition
著者 (3件):
資料名:
巻: 218  ページ: 448-459  発行年: 2016年 
JST資料番号: W0360A  ISSN: 0925-2312  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,最新のコネクショニスト(a.k.a.,ハイブリッド)自動音声認識(ASR)システムにおける話者間変動性のおかげで,訓練および試験条件の間の潜在的な音響不整合に起因する性能劣化の問題に対処するための深層ニューラルネットワーク(DNN)の学習を移動への統一的アプローチを提案した。話者適応に関係した深いニューラルネットワークの知識を移動させるために種々のスキームを本研究で調べた三のフレームワークで示したようにそのような統一概念下で容易に開発できる。最初の溶液中では,知識は均一領域,即ち,ソース及びターゲットドメインの間を移動する。さらに移動は驚きターゲット話者からの発話に及ぼすASR精度を高めるために源話者にターゲットから逐次的に起こる。第二溶液中では,ターゲット話者に及ぼすASRシステム性能を改善するためのコネクショニストパラメータを調整するために採用されたマルチタスクアプローチ。知識は不均一タスク間同時に移動し,元のDNN構造に一つまたはそれ以上の小さい補助出力層を添加することによって達成した。第三溶液中では,コネクショニストパラメータを調整し,ルートノードからの事前知識を構造的最大事後確率様式葉への訓練と試験条件の間のギャップを埋めるためにDNN出力クラスは階層構造に組織化される。Wall Street Journal(WSJ)音声認識タスク上で一連の実験を通して,提案した解決策は一貫して統計的に有意な単語誤り率の削減をもたらすことを示した。最も重要なことは,転移学習は,話者適応を可能にする技術であることを示し,それは音声地域に適応した通常変換に基づく適応アルゴリズムと多重条件訓練(MCT)スキームの両方,ソース及びターゲットドメインのデータは訓練時間で利用可能な場合の両方の場合より音声における音響変動をカバーするためによく用いられているデータの組合せ方法を優れているからである。最後に,実験的な証拠は,ターゲット話者からの単一文章のみが利用できる場合でも,全ての提案した解は負の移動に対してロバストであることを示した。Copyright 2017 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  ニューロコンピュータ 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る