プレプリント
J-GLOBAL ID:202202205075403971   整理番号:21P0071951

話者ダイアリゼーションにおけるxベクトルシーケンス(VBx)のBayes HMMクラスタリング:標準タスクに関する理論,実装および解析【JST・京大機械翻訳】

Bayesian HMM clustering of x-vector sequences (VBx) in speaker diarization: theory, implementation and analysis on standard tasks
著者 (4件):
資料名:
発行年: 2020年12月29日  プレプリントサーバーでの情報更新日: 2020年12月29日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
最近提案されたVBx拡張法は,Bayes隠れMarkovモデルを使用し,xベクトルのシーケンスにおける話者クラスタを見つける。本研究では,文献における他のアプローチとVBxダイラリゼーションの性能の広範な比較を行い,VBxが,ダイラリゼーションを評価するための最も一般的なデータセットの3つに対して優れた性能を達成することを示した:CALLHOME,AMIおよびDIHARDIIデータセット。さらに,フレームごとの標準セプストラム特徴で動作する以前のより複雑なBHMMモデルと比較して,このモデルの効率と単純さに焦点を当てて,VBxモデルの導出と更新公式を初めて提示した。この発表と共に,著者らは,広いおよび狭帯域データの両方に関する著者らの実験で使用されるxベクトル抽出器を訓練するためのレシピを解放し,そして,すべての3つのデータセットに関して最先端の性能を達成するVBxレシピを解放した。さらに,AMIデータセットのための標準化された評価プロトコルの欠如を指摘し,著者らは公式のAMI分割と転写に基づくビーム成形とMix-Headsetオーディオの両方のための新しいプロトコルを提案する。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 

前のページに戻る