文献
J-GLOBAL ID:201502214032241050   整理番号:15A0598824

残響下音声認識におけるモデル学習用インパルス応答の最適化

Optimization of impulse responses for model training in reverberant speech recognition
著者 (4件):
資料名:
巻: 114  号: 473(EA2014 72-130)  ページ: 37-42  発行年: 2015年02月23日 
JST資料番号: S0532B  ISSN: 0913-5685  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
実環境において音声認識システムを利用すると,残響などの影響を受けて音声認識性能が著しく劣化する。耐残響に関するアプローチの1つとして,残響音声を音響モデルの学習に用いる手法が広く研究されており,特に従来は残響時間が異なる環境の残響音声から音響モデルを構築する手法が利用されてきた。しかし,音声認識性能は発話者とマイクロホン間の位置関係に大きく依存するため,同一室内で固有の値を有する残響時間だけでは,適切な音響モデルの学習に限界があると考えられる。これまでに,我々は室内音響指標に基づいて残響下音声認識における音響モデルの学習法を提案した。提案手法では,発話者とマイクロホン間の位置関係に依存して変動する室内音響指標のD値に着目し,このD値が異なるインパルス応答を用いて音響モデルを構築することで,残響環境下で音声認識性能を改善させることができた。そこで本稿では,音響モデルの学習に用いるインパルス応答の最適化(具体的には,D値算出時の初期・後続反射音の境界時間,インパルス応答の数)に取り組んだ。評価実験結果より,残響時間とD50が異なる9ケ所のインパルス応答を用いて残響マッチドな音響モデルを構築することで,高い音声認識性能を達成することができた。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  人工知能 
引用文献 (18件):
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る