スペクトルエントロピーを用いた効率的話者同定【JST・京大機械翻訳】

Luque-Suarez Fernando; Camarena-Ibarrola Antonio; Chavez Edgar

文献

J-GLOBAL ID：201902223170901392 整理番号：19A1661177

スペクトルエントロピーを用いた効率的話者同定【JST・京大機械翻訳】

Efficient speaker identification using spectral entropy

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=19A1661177&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=19A1661177&from=J-GLOBAL&jstjournalNo=W1102A") }}

著者 (3件)： , ,
資料名：
巻： 78 号： 12 ページ： 16803-16815 発行年： 2019年
JST資料番号： W1102A ISSN： 1380-7501 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：ドイツ (DEU) 言語：英語 (EN)

音声認識において,2つの主な問題は音声認識(何かと言われる)と話者認識(話された)である。話者認識のための通常の方法は,話者の同一性がモデルのパラメータに対応するモデルを仮定することであり,候補話者の数が大きい場合には,推定が時間がかかる可能性がある。本論文では,音声信号から抽出したエントロピーに基づく特徴の高次元点雲として話者をモデル化した。この方法はインデクシングを可能にし,したがって,それは大規模データベースを管理することができる。著者らは,1000の異なる話者のYouTubeビデオの収集からオーディオを抽出することによって形成された公開利用可能なデータベースによる同定の品質を実験的に評価した。20秒のオーディオエクセルにより,記録環境を制御しない場合には97%の精度で話者を識別でき,制御された記録環境に対しては99%の精度が得られた。Copyright 2019 Springer Science+Business Media, LLC, part of Springer Nature Translated from English into Japanese by JST.【JST・京大機械翻訳】

, , , , , , , , , ,
, , , , 【Automatic Indexing@JST】

著者キーワード (3件)： , ,

図形・画像処理一般

前のページに戻る