文献
J-GLOBAL ID:202002211263424303   整理番号:20A1890511

スタック自動エンコーダに基づくロバストな話者認識【JST・京大機械翻訳】

Robust Speaker Recognition Based on Stacked Auto-encoders
著者 (5件):
資料名:
巻: 1264  ページ: 390-399  発行年: 2020年 
JST資料番号: W5075A  ISSN: 2194-5357  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: ドイツ (DEU)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
話者認識は,話者の音声セグメントを利用してアイデンティティを認識するバイオメトリックモダリティであり,試験話者が登録話者の1つに属するかどうかを決定する。交差チャネル条件に関するi-ベクトルフレームワークのロバスト性を改良して,話者認識に深い学習を適用するためのノバ方式を探究するために,Stacked自己エンコーダを適用して,PLDAを適用する代わりにi-ベクターの抽象抽出を得た。前処理と特徴抽出の後,話者とチャネル独立音声をUBM訓練のために採用する。次に,UBMを用いて,登録と試験音声のiベクトルを抽出した。次元を減らし,話者部分空間間の識別を増すために線形判別分析(LDA)を使用する従来のi-ベクトルフレームワークとは異なり,本研究では,低次元のi-ベクトルを再構成するために積層自動エンコーダを用いて,最終分類を達成するために,異なる分類器を選択できる。実験結果は,提案方法が最先端の方法より良い性能を達成することを示した。Copyright Springer Nature Switzerland AG 2021 Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る