文献
J-GLOBAL ID:201402286316836340   整理番号:14A0685702

i-vectorを用いた話者認識

著者 (2件):
資料名:
巻: 70  号:ページ: 332-339  発行年: 2014年06月01日 
JST資料番号: G0162A  ISSN: 0369-4232  CODEN: NIOGAH  資料種別: 逐次刊行物 (A)
記事区分: 解説  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
話者認識研究の初学者を対象に,i-vectorとは何か,どのように抽出するのか,i-vectorをどのように用いて話者認識を行うのかについて,重要な文献を紹介しながら丁寧に解説した。また,確率的線形判別分析(PLDA)等,i-vectorの関連技術や,それらが実装されてたツールについても紹介した。本解説は,1)はじめに,2)i-vectorの概観(GMMスーパベクトル/ジョイント因子分析(JFA)/i-vector/i-vectorによる話者照合),3)i-vector及び因子分析モデルパラメータの推定(UBMに対するBaum-Welch統計量/全因子wの確率分布とi-vectorの抽出/モデルパラメータT,Σの推定),4)話者内変動補正(部分空間に基づく話者内変動補正/PLDAに基づく話者内変動補正),5)ツール(JFA Matlab demo/ALIZE),6)おわりに,から構成されている。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
引用文献 (27件):
  • N. Dehak, P. Kenny, R. Dehak, P. Dumouchel and P. Ouellet, “Front-end factor analysis for speaker verification,“ IEEE Trans. Audio Speech Lang. Process., 19, 788-798 (2011).
  • S.J.D. Prince, “Probabilistic linear discriminant analysis for inference about identity,“ Proc. ICCV2007, pp. 1-8 (2007).
  • P. Kenny, “Bayesian speaker verification with heavy tailed priors,“ Proc. Odyssey2010 (2010).
  • D. Garcia-Romero and C.Y. Espy-Wilson, “Analysis of i-vector length normalization in speaker recognition system,“ Proc. INTERSPEECH2011, pp. 249-252 (2011).
  • D. Reynolds, T.F. Quatieri and R.B. Dunn, “Speaker verification using adapted Gaussian mixture models,“ Digital Signal Process., 10, 19-41 (2000).
もっと見る
タイトルに関連する用語 (1件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る