文献
J-GLOBAL ID:202102274982921391   整理番号:21A1629851

経験的モード分解と畳込みニューラルネットワークを用いた構音障害音声認識の改善【JST・京大機械翻訳】

Improving dysarthric speech recognition using empirical mode decomposition and convolutional neural network
著者 (4件):
資料名:
巻: 2020  号:ページ: 1-7  発行年: 2020年 
JST資料番号: U8251A  ISSN: 1687-4722  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: イギリス (GBR)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,経験的モード分解とHurstベースモード選択(EMDH)を,畳込みニューラルネットワーク(CNN)を用いて深層学習アーキテクチャと共に用いて,構音音声の認識を改善した。EMDH音声強調技術を前処理ステップとして用いて,構音音声の品質を改善した。次に,Mel-周波数ケプストラム係数を,CNNベースの認識器への入力特徴として使用するために,EMDHによって処理した音声から抽出した。提案したEMDH-CNN手法の有効性を,構音音声のNemoursコーパスで得られた結果により実証した。Gauss混合モデル(HMM-GMM)と増強モジュールのないCNNを用いたHiddenMarkovを使用するベースラインシステムと比較して,EMDH-CNNシステムは,k倍交差検証実験セットアップを用いて,それぞれ,全精度を20.72%と9.95%増加させた。Please refer to the publisher for the copyright holders. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
引用文献 (20件):
  • Disorders of communication; Neurological Rehabilitation; 2013; 273-281; CR1; citation_author=Pam Enderby
  • Med. Eng. Phys.; Investigation of an hmm/ann hybrid structure in pattern recognition application using cepstral analysis of dysarthric (distorted) speech signals; P. D. Polur, G. E. Miller; 28; 8; 2006; 741-748; 10.1016/j.medengphy.2005.11.002; citation_id=CR2
  • M. Hasegawa-Johnson, J. Gunderson, A. Perlman, T. Huang, in 2006 IEEE International Conference on Acoustics Speech and Signal Processing Proceedings, Toulouse. Hmm-Based and Svm-Based Recognition of the Speech of Talkers With Spastic Dysarthria, (2006), pp. III-III. https://ieeexplore.ieee.org/abstract/document/1660840. https://doi.org/10.1109/ICASSP.2006.1660840.
  • M. J. Kim, B. Cao, K. An, J. Wang, in Interspeech. Dysarthric speech recognition using convolutional lstm neural network, (2018), pp. 2948-2952. https://www.researchgate.net/publication/327350843_Dysarthric_Speech_Recognition_Using_Convolutional_LSTM_Neural_Network.
  • S. Young, G. Evermann, M. Gales, T. Hain, D. Kershaw, G. Moore, J. Odell, D. Ollason, D. Povey, V. Valtchev, et al., The htk book (for htk version. 3.3), Cambridge University Engineering Department, 2005 (2006). http://htk.eng.cam.ac.uk/docs/docs.shtml.
もっと見る
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る