文献
J-GLOBAL ID:202202229949663682   整理番号:22A1077649

高精度な話者照合のためのTransformerを用いた話者特徴量抽出

Speaker Feature Extraction Using Transformer for High Accuracy Speaker Recognition.
著者 (5件):
資料名:
巻: 2022  号: 春季  ページ: ROMBUNNO.1-3-12  発行年: 2022年02月23日 
JST資料番号: G0381C  ISSN: 1880-7658  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
・Transformer Encoderを用いて話者特徴量を抽出する手法の提案。
・提案手法の性能を検証するために,同条件で提案手法とx-vectorベースの従来手法の学習を行い,評価結果を比較。
・提案法によって,限られた計算資源の中でも非常に高い照合性能を達成できるということを実証。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
引用文献 (13件):
  • N. Dehak et al., “Front-end factor analysis for speaker verification,” IEEE Transactions on Audio, Speech, and Language Processing, vol. 19, no. 4, pp. 788-798, 2010.
  • D. Snyder et al., “Deep neural network embeddings for text-independent speaker verification.” in Interspeech, pp. 999-1003, 2017.
  • A. Vaswani et al., “Attention is all you need,” in Advances in neural information processing systems, pp. 5998-6008, 2017.
  • D. Snyder et al., “Speaker recognition for multi-speaker conversations using x-vectors,” in ICASSP, pp. 5796-5800. IEEE, 2019.
  • D. Snyder et al., “The jhu speaker recognition system for the voices 2019 challenge.” in INTERSPEECH, pp. 2468-2472, 2019.
もっと見る
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る