研課題
J-GLOBAL ID:202104013617510650  研究課題コード:13411820

モバイル環境を指向した環境・話者適応型音声認識の実環境性能検証

実施期間:2013 - 2013
実施機関 (1件):
研究責任者: ( , 情報科学研究科, 准教授 )
研究概要:
モバイル環境において、周囲環境や使用機材、話者の違いを簡易で高速に吸収して高い音声認識精度を得る手法を検討した。環境や機材などの、不特定多数に共通する音声への複数の影響要因と、話者の違いの要因を区別し、それらの組み合わせとなる特定の環境には各要因への対応を組み合わせることで対処する方法を考案した。具体的には、音声のモデル(音響モデル)の適応のための最尤線形回帰法(MLLR法)の変換行列を、環境ごと、機材ごとに保存し、その組み合わせを行列の積で表現する。この行列で環境適応された音響モデルを話者適応することにより、周囲環境・機材・話者すべてに適応した音響モデルを作成できることを示した。いくつかの環境・機材で収録した音声で実験した結果、その効果を確認した。
研究制度:
研究所管機関:
国立研究開発法人科学技術振興機構

前のページに戻る