文献
J-GLOBAL ID:202002262856445631   整理番号:20A1345984

2人の人々により同期的に発話されたキーフレーズのテキスト依存閉集合2話者認識【JST・京大機械翻訳】

Text-Dependent Closed-Set Two-Speaker Recognition of a Key Phrase Uttered Synchronously by Two Persons
著者 (4件):
資料名:
巻: 189  ページ: 405-413  発行年: 2020年 
JST資料番号: W5072A  ISSN: 2190-3018  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: ドイツ (DEU)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,2つの人,すなわち,非中毒でed音されたキーフレーズを用いた,新しいテキスト依存話者認識システムを提案した。ここでは,この音声をduo発話として言及する。この提案したシステムは,登録話者対により発話されたduo発話を受け入れるが,他の話者対からduo発話を拒絶し,単一話者により発話する発話を拒否する。従来の話者認識システムからの差異は,提案システムが話者認識のためにduo発話を必要とするということであった。したがって,提案システムは,このシステムがduo発話を必要とするので,高レベルセキュリティシステムであることが期待される。提案システムを実現するために,dベクトルと隠れMarkovモデル(HMM)を採用した。d-ベクトルは話者識別深層ニューラルネットワーク(DNN)によって抽出された特徴ベクトルであり,フレームレベル音響特徴を用いて話者と話者ペアを同定するために訓練される。さらに,HMMはテキスト依存話者認識システムの話者モデルに適していることが広く知られている。提案した方法を評価するために,話者識別実験を行った。実験結果は,提案したシステムがMFCCベースのシステムより高い性能を達成することを示した。さらに,将来のシステムを改善するための実験結果の誤差を調べた。Copyright The Editor(s) (if applicable) and The Author(s), under exclusive license to Springer Nature Singapore Pte Ltd. 2021 Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る