文献
J-GLOBAL ID:201502201665488620   整理番号:15A1148941

制約を緩和した尤度計算を備えた単語HMMによる区間検出誤りに頑健な孤立単語認識

Robust Speech Recognition against Misdetection Using Whole-Word HMMs and Relaxed Algorithm for Likelihood Calculation
著者 (1件):
資料名:
巻: 135  号: 10  ページ: 1236-1243 (J-STAGE)  発行年: 2015年 
JST資料番号: S0810A  ISSN: 0385-4221  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
制約を緩和した尤度計算アルゴリズムを備えた,単語HMMによる区間検出誤りに頑健な孤立単語認識手法を提案した。筆者らは,先に単語モデルによる単語認識専用ハードウェアを構築したが,このシステムは,音声入力をスイッチにより制御しているため,本来の音声区間よりも短く検出される脱落誤りや長く検出される拡張誤りを引き起こす。脱落誤りに対して,従来のシステムでは検出された区間の始終端を拡張し,モデルに非音声状態を付与することで対処しているが,雑音環境下ではなお,脱落誤りを引き起こす可能性がある。本論文では,上記脱落誤りに対処するため,初期化・終了処理の制約をパラメータで緩和できる尤度計算アルゴリズムを用いた認識手法を提案した。認識性能を従来の尤度計算法と比較した実験結果は,提案手法の有効性を示した。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
引用文献 (13件):
  • (1) Y. Choi, K. You, J. Choi, and W. Sung: “VLSI for 5000-word continuous speech recognition”, Proc. ICASSP, pp. 557-560, Taipei, Taiwan (2009)
  • (2) N. Hayasaka, S. Yoshizawa, N. Wada, Y. Miyanaga, and N. Hataoka: “A Study of Robust Speech Recognition System and Its LSI Design”, Trans. of SICE, Vol. 41, No. 5, pp. 473-480 (2005) (in Japanese)
  • 早坂 昇・吉澤真吾・和田直哉・宮永喜一・畑岡信夫:「ロバスト音声認識とそのLSI化について」,計測自動制御学会論文集,Vol. 41, No. 5, pp. 473-480 (2005)
  • (3) S. Yoshizawa, N. Wada, N. Hayasaka, and Y. Miyanaga: “Scalable Architecture for Word HMM-Based Speech Recognition and VLSI Implementation in Complete System”, <i>IEEE Trans. Circuits</i> & <i>Systems-I</i>, Vol. 53, No. 1, pp. 70-77 (2006)
  • (4) A. Benyassine, E. Shlomot, and H. Su: “ITU-T Recommendation G. 729 Annex B: a silence compression scheme for use with G. 729 optimized for V. 70 digital simultaneous voice and data applications”, IEEE Commun. Mag., Vol. 35, No. 9, pp. 64-73 (1997)
もっと見る

前のページに戻る