文献
J-GLOBAL ID:201702233344122147   整理番号:17A1024826

ロバストな話者検証のためのPLDAのDNN駆動混合【Powered by NICT】

DNN-Driven Mixture of PLDA for Robust Speaker Verification
著者 (3件):
資料名:
巻: 25  号:ページ: 1371-1383  発行年: 2017年 
JST資料番号: W0508B  ISSN: 2329-9290  CODEN: ITASFA  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
異なるタイプ変動のために登録および試験発話間の不整合は,話者検証における大きな課題である。SNRレベル変動あるいはチャネル型変動はiベクトル空間における不均一クラスタを引き起こすという観察に基づいて,本論文では,確率的線形判別分析(PLDA)混合モデルの学習を駆動またはガイドするための教師つき学習の適用を提案した。特に,深いニューラルネットワーク(DNN)を異なるSNRレベルの事後確率または入力としてiベクトルが与えられたチャネルタイプを生成するために訓練した。これらの事後確率は,PLDAの混合物における指標変数の事後確率を置き換えた。PLDAの通常の混合物と比較して,識別訓練は混合モデルを引き起こすiベクトル空間のより合理的な軟質部を行った。検証,テストiベクトルと目標話者のiベクトル与えられた時,同じ話者仮説の限界尤度はDNN法で製造した部品事後確率により重みづけされた成分尤度を合計することによって,異なる話者仮説のための同様に得られた。NIST2012SREに基づく結果は,両トレーニングと試験発話がSN比と異なるチャネルタイプの広い範囲をカバーする提案した方式は,より現実的な状況の下でより良い性能をもたらすことを示した。SNR不整合に焦点を当てるのみPLDAの以前のSN比依存混合物とは異なり,提案したモデルは,より一般的であり,音声における変動の異なるタイプの処理に適用できる可能性がある。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る