研課題
J-GLOBAL ID:202104011917914393
研究課題コード:13409961
顔部位特徴を用いたユニバーサル音声認識の研究開発
実施期間:2013 - 2013
実施機関 (1件):
研究責任者:
(
, 都市安全研究センター, 准教授 )
研究概要:
本研究開発では,障害者の自立生活支援を目指し,雑音環境下で頑健に発話認識を行う手法の一つとして,顔部位画像情報を,音声情報に併用したマルチモーダル認識を行う.実際の生活環境下では,発話者の顔が横を向いてしまうと,画像センサーから見た時の顔の形が変わるため,認識精度が大きく劣化する.本研究では,Active Appearance Modelsを用いることで,大語彙連続発話のタスクにおいて,雑音下での斜め方向発話に対して認識精度を改善することが出来た.今後は,少量学習データによる音響及び画像モデル適応化,不特定話者による認識を検討する事により,実用化を目指して行く.
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した研究課題タイトルの用語をもとにしたキーワードです
,
,
,
研究制度:
>
>
>
研究所管機関:
前のページに戻る