文献
J-GLOBAL ID:202102253186183281   整理番号:21A2837457

条件を超えたロバスト性能を有する話者検証バックエンド【JST・京大機械翻訳】

A speaker verification backend with robust performance across conditions
著者 (3件):
資料名:
巻: 71  ページ: Null  発行年: 2022年 
JST資料番号: T0677A  ISSN: 0885-2308  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: イギリス (GBR)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,開発中の未知または未知の条件における話者検証の問題に取り組んだ。話者検証のための標準方法は,深いニューラルネットワークで話者埋込みを抽出し,確率的線形判別分析(PLDA)とグローバルロジスティック回帰スコアキャリブレーションからなるバックエンドを通してそれらを処理することから成る。この方法は,キャリブレーションモデルを訓練するのに用いる条件とは異なる条件に乏しいシステムをもたらすことが知られている。標準バックエンドを修正し,入力の条件に適応するために,継続時間と他の自動的に抽出したサイド情報を使用する適応キャリブレータを導入した。バックエンドは,二値交差エントロピーを最適化するために識別的に訓練された。話者に関してのみラベル付けされた多数の多様なデータセット上で訓練されたとき,提案したバックエンドは一貫して,そして,いくつかの場合において,標準PLDAアプローチと比較して,キャリブレーションを劇的に改善し,その幾つかは訓練データから著しく異なる。識別性能も一貫して改善した。著者らは,PLDAと適応キャリブレータの共同訓練が必須であり,PLDAを凍結し,キャリブレータを微調整するとき,同じ利益は達成できないことを示した。著者の知る限りでは,本論文における結果は,多様な条件に対してロバストアウトオブボックス性能を有する話者検証システムを開発することが可能であるという文献における最初の証拠である。Copyright 2021 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る