プレプリント
J-GLOBAL ID:202202210304476728   整理番号:22P0294961

OpenFEAT:変圧器によるオープンセット少数ショット埋込み適応による話者同定の改善【JST・京大機械翻訳】

openFEAT: Improving Speaker Identification by Open-set Few-shot Embedding Adaptation with Transformer
著者 (7件):
資料名:
発行年: 2022年02月24日  プレプリントサーバーでの情報更新日: 2022年02月24日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
少数の登録発話による家庭話者識別は,特に家庭のメンバーが類似した音声特性と部屋音響を共有するとき,重要だが挑戦的な問題である。多数の話者から学習された共通の埋込み空間は,家庭におけるあらゆる話者の最適識別に普遍的に適用できない。本研究では,まず,少数ショットオープンセット認識タスクとして家庭話者識別を定式化し,次に,セットツーセット関数を用いて,与えられた普遍的埋込み空間から話者表現を適応させる新しい埋込み適応フレームワークを提案し,より良い家庭話者識別性能を得た。著者らのアルゴリズムによって,変換器(オープンFEAT)によるオープンセット少数ショット埋込みアダプテーション,著者らは,2~7のハードから識別する話者を有する模擬家庭に関する話者同定等誤り率(IEER)が,23%から31%まで減少することを観察した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る