雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識

甲斐常伸; 鈴木雅之; 峯松信明; 広瀬啓吉

文献

J-GLOBAL ID：201202264696181238 整理番号：12A0927935

雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識

Combination of noise compensation and SPLICE for noise robust speech recognition

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=12A0927935&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=12A0927935&from=J-GLOBAL&jstjournalNo=S0532B") }}

著者 (4件)： , , ,
資料名：
巻： 112 号： 49(SP2012 1-32) ページ： 161-166 発行年： 2012年05月17日
JST資料番号： S0532B ISSN： 0913-5685 資料種別：会議録 (C)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

近年携帯端末やカーナビゲーションシステムなどを,音声入力を用いて操作する場面が多くなっている。しかし実環境下での音声入力は様々な雑音が混入してしまい,クリーン環境で構築された音響モデルのみが使われていた場合,認識率の大きな低下を招くことになる。音声の特徴量から雑音の影響を取り除く手法は特徴量正規化,特徴強調など様々な手法が提案されているが,単一の手法で影響をすべて取り除くことは難しい。そこで本稿ではこれらの手法を組み合わせてより雑音に頑健な音声認識を目指す。SPLICE(Stereo-Piecewise LInear Compensation for Environments)は任意の特徴量を入力として扱える高い汎用性を持っている。そこで既存手法とSPLICEの組み合わせの中で,各手法の特性が有効に働くを組み合わせを検討する。Aurora-2データベースを用いた英語連続数字音声認識のタスクにおいて,AFE(Advanced Front-End),SPLICE,HEQ(Histogram EQualization)を順番に適用した特徴量がどの環境においても優れた性能を示した。(著者抄録)

, , , , , ,

パターン認識

, ,

前のページに戻る