文献
J-GLOBAL ID:201702279652958435   整理番号:17A1463985

GMAT:多重解像度絶対Teager-Kaiserエネルギー演算子に基づく声門閉鎖瞬間検出【Powered by NICT】

GMAT: Glottal closure instants detection based on the Multiresolution Absolute Teager-Kaiser energy operator
著者 (3件):
資料名:
巻: 69  ページ: 286-299  発行年: 2017年 
JST資料番号: W1600A  ISSN: 1051-2004  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
声門閉鎖瞬間(GCI)検出は,多くの音声応用に重要である。しかし,ほとんどの既存アルゴリズムは計算効率と精度を同時に達成することはできない。本論文では,高い精度と低い計算コストでGCIを検出できる多重解像度絶対TKEO(GMAT)に基づく声門閉鎖瞬間検出を示した。発声における非線形性を考慮して,Teager Kaiser Energy Operator(TKEO)はGCIを検出するために利用され,高い絶対TKEO値と瞬間はしばしばGCIを示した。ロバスト性を高めるために,三種類のマルチスケールプーリング,最大プーリング,マルチスケール生成物と平均プーリングは,いくつかのスケールのヒューズ絶対TKEOsに適用した。最後に,GCIは,融合結果に基づいて検出した。性能評価において,GMATは三種類の最先端レベル手法,MSM(最も特異な多様体に基づくアプローチ),ZFR(零周波数共振器法),SEDREAMS(残留励起を用いた音声事象検出平均ベース信号と)と比較した。クリーン音声について,実験はGMATはMSMよりも高い同定率,精度を達成できることを示した。ZFRとSEDREAMSと比較して,GMATはほぼ同じ信頼性と高い精度を示した。添加では,雑音の多い音声に対するGMATは最もSNRレベルの最も高いロバスト性を示した。追加比較はGMATであるマルチスケール処理におけるスケールの選択に敏感でなく,低計算コストを持つことを示した。最後に,GCIの具体的応用例である,病的音声同定は実際にGMATの有効性を示すために含まれている。本論文を通して,筆者らはGCI検出のためのTKEOの可能性を研究して,提案したアルゴリズムGMATは,高い精度と低い計算コストでGCIを検出することができる。GMATの優位性のために,GCI検出のための有望な選択,特に実時間シナリオである。それ故,本研究では,GCIに依存するシステム,精度と計算コストの両方が重要であるに寄与する可能性がある。Copyright 2017 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  図形・画像処理一般 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る