文献
J-GLOBAL ID:202202254233910642   整理番号:22A0288210

テキストに依存しないフォレンジック話者認識のためのマルチソース領域適応【JST・京大機械翻訳】

Multi-Source Domain Adaptation for Text-Independent Forensic Speaker Recognition
著者 (2件):
資料名:
巻: 30  ページ: 60-75  発行年: 2022年 
JST資料番号: W0508B  ISSN: 2329-9290  CODEN: ITASFA  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
新しい環境に対する話者認識システムの適応は,大規模データからタスク固有の小規模データシナリオに向けて学習された坑井形成モデルを改善するために広く使用された技術である。しかしながら,以前の研究は,訓練データが法医学シナリオで必要な複数の音響ドメインから収集されるより実用的なシナリオを無視する,単一ドメイン適応に焦点を合わせている。法医学話者認識のためのオーディオ分析は,参照と自然のフィールド記録の間の位置/シナリオ不確実性と多様性不整合によるマルチドメイン訓練データによるモデル訓練におけるユニークな課題を提供する。また,ドメイン不整合と性能損失により複雑なニューラルネットワークアーキテクチャを訓練するために,小規模ドメイン固有データを直接使用することは難しい。微調整は,よく訓練されたモデルから初期化された重みでモデルを再訓練するために適応のための一般的に使用される方法である。代わりに,本研究では,ドメイン敵対訓練,不一致最小化,およびモーメントマッチングアプローチに基づく3つの新しい適応法を提案して,複数の音響ドメインにわたる適応性能をさらに促進した。実験の包括的なセットは,以下を示した。1)多様な音響環境は,音声法医学における研究を進めることができる話者認識性能に影響し,2)ドメイン敵対訓練は,ドメイン間のシフトに不変である識別特徴を学習し,また,矛盾最小化適応は,複数の音響ドメインにわたって同時に有効な性能を達成し,そして4)動的分布アラインメントに沿ったモーメントマッチング適応は,特に,全ての他のシステムと比較して,雑音のあるLENA場領域に対して,各ドメイン上の話者認識性能を著しく促進する。したがって,適応においてここで示したアドバンスは,オーディオ法医学におけるフィールド操作データに対するより一貫した性能を確実にする。Copyright 2022 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る