文献
J-GLOBAL ID:202002283690740701   整理番号:20A0276904

混合帯域幅と多領域話者認識のためのNEC-TTシステム【JST・京大機械翻訳】

NEC-TT System for Mixed-Bandwidth and Multi-Domain Speaker Recognition
著者 (8件):
資料名:
巻: 61  ページ: Null  発行年: 2020年 
JST資料番号: T0677A  ISSN: 0885-2308  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: イギリス (GBR)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,2018の話者認識評価(SRE’18)ベンチマーキングのために設計されたNEC-TT話者認識システムについて述べた。NEC-TTサブミッションは,国立標準技術研究所(NIST)によって組織化されたSREの最新版における最良実行システムの間にあった。それは,深い話者埋め込みフロントエンドに基づく複数のサブシステムと,それに続く確率的線形判別分析(PLDA)バックエンドを含む。話者埋め込みは,単純な幾何学的操作を持つ話者音声間の容易な比較を可能にする連続値ベクトル表現である。深い話者埋込みの有効性は,訓練データの量と多様性に依存する。この目的のために,訓練例と話者の数を増加させるために,データ増強と混合帯域幅訓練戦略にヒンジをかけた。そうすることによって,著者らは訓練データの量を増加させるだけでなく,より多くの話者クラスを有する出力ソフトマックス層を拡大した。システム設計の観点から,著者らは,ドメイン特異的PLDAバックエンドを伴う一般的なマルチドメインスピーカ埋め込みフロントエンドから成る2段階パイプラインを採用した。これは,同じ話者埋め込みフロントエンドが,複数のドメイン適応PLDAバックエンドを用いて,あらゆる特定の配置に対して,より多くの領域適応PLDAを用いることができるので,商業的展開において有意な利益を有する。本論文は,設計方法論,データ拡張,帯域幅拡張,マルチヘッド注意,PLDA適応,およびNEC-TTのSRE’18結果における良好な性能に寄与した他の要素の詳細な記述と解析を提供した。Copyright 2020 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る