抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
十分統計量を用いた教師なし話者適応において,選択する話者の数を決定する手法を提案する。音声認識における高速な教師なし話者適応の一つとして,話者毎の十分統計量を用いた手法が提案されている。これは,予め用意した複数の話者の中から,評価話者に音響的な特徴が近い話者を選択し,選択された話者の十分統計量を用いて,評価話者に適応した音響モデルを構築する手法である。従来手法では,評価話者に音響的な特徴が近い話者を選択する際,複数の話者の中から,予め定められた数だけ選択する。提案手法では,評価話者と予め用意した話者との音響特徴量空間における話者間距離を基準に,選択する話者の数を決定する。電話による対話音声を用いた認識実験において,従来手法に比較し,単語正解精度が0.74ポイント向上した。特に,音響的な特徴が近い話者が少ない評価話者に対して有効であることを確認した。(著者抄録)