Proj
J-GLOBAL ID:202104013617510650
Research Project code:13411820
モバイル環境を指向した環境・話者適応型音声認識の実環境性能検証
モバイル環境を指向した環境・話者適応型音声認識の実環境性能検証
Study period:2013 - 2013
Organization (1):
Research responsibility:
(
, 情報科学研究科, 准教授 )
Research overview:
モバイル環境において、周囲環境や使用機材、話者の違いを簡易で高速に吸収して高い音声認識精度を得る手法を検討した。環境や機材などの、不特定多数に共通する音声への複数の影響要因と、話者の違いの要因を区別し、それらの組み合わせとなる特定の環境には各要因への対応を組み合わせることで対処する方法を考案した。具体的には、音声のモデル(音響モデル)の適応のための最尤線形回帰法(MLLR法)の変換行列を、環境ごと、機材ごとに保存し、その組み合わせを行列の積で表現する。この行列で環境適応された音響モデルを話者適応することにより、周囲環境・機材・話者すべてに適応した音響モデルを作成できることを示した。いくつかの環境・機材で収録した音声で実験した結果、その効果を確認した。
Terms in the title (6):
Terms in the title
Keywords automatically extracted from the title.
,
,
,
,
,
Research program:
>
>
>
Organization with control over the research:
Japan Science and Technology Agency
Return to Previous Page