残響下音声認識におけるモデル学習用インパルス応答の最適化

福森隆寛; 中山雅人; 西浦敬信; 山下洋一

文献

J-GLOBAL ID：201502214032241050 整理番号：15A0598824

残響下音声認識におけるモデル学習用インパルス応答の最適化

Optimization of impulse responses for model training in reverberant speech recognition

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=15A0598824&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=15A0598824&from=J-GLOBAL&jstjournalNo=S0532B") }}

著者 (4件)： , , ,
資料名：
巻： 114 号： 473(EA2014 72-130) ページ： 37-42 発行年： 2015年02月23日
JST資料番号： S0532B ISSN： 0913-5685 資料種別：会議録 (C)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

実環境において音声認識システムを利用すると,残響などの影響を受けて音声認識性能が著しく劣化する。耐残響に関するアプローチの1つとして,残響音声を音響モデルの学習に用いる手法が広く研究されており,特に従来は残響時間が異なる環境の残響音声から音響モデルを構築する手法が利用されてきた。しかし,音声認識性能は発話者とマイクロホン間の位置関係に大きく依存するため,同一室内で固有の値を有する残響時間だけでは,適切な音響モデルの学習に限界があると考えられる。これまでに,我々は室内音響指標に基づいて残響下音声認識における音響モデルの学習法を提案した。提案手法では,発話者とマイクロホン間の位置関係に依存して変動する室内音響指標のD値に着目し,このD値が異なるインパルス応答を用いて音響モデルを構築することで,残響環境下で音声認識性能を改善させることができた。そこで本稿では,音響モデルの学習に用いるインパルス応答の最適化(具体的には,D値算出時の初期・後続反射音の境界時間,インパルス応答の数)に取り組んだ。評価実験結果より,残響時間とD₅₀が異なる9ケ所のインパルス応答を用いて残響マッチドな音響モデルを構築することで,高い音声認識性能を達成することができた。(著者抄録)

, , , , , , ,
, , ,

音声処理 , 人工知能

引用文献 (18件)：

, , , ,

前のページに戻る