研課題
J-GLOBAL ID:202104007986284876
研究課題コード:13412380
実環境に向けたマルチモーダル声質変換手法の研究開発
実施期間:2013 - 2013
実施機関 (1件):
研究責任者:
(
, 工学部, 助教 )
研究概要:
本研究課題では、入力された音声(元話者)を別の人の音声(目標話者)に変換する「声質変換技術」と、音声・画像など複数の情報を統合的に処理する「マルチモーダル技術」を用いた、「マルチモーダル声質変換技術」の確立を目指した。これは、元話者の音声と画像(口唇動画像)を用いて、雑音下・実環境下でも音質の低下を抑えつつ、目標話者の音声に変換する技術である。実環境を想定した音響雑音や画像外乱を入力音声・画像に施し、従来の声質変換とマルチモーダル声質変換の比較実験を行った。結果、雑音環境下で従来手法より変換音声の音質が向上し、画像外乱に対しても頑健性を確認した。今後は実用化を見据え、マルチモーダル技術の高度化による音質改善と、モバイル端末への実装を行う。
タイトルに関連する用語 (6件):
タイトルに関連する用語
J-GLOBALで独自に切り出した研究課題タイトルの用語をもとにしたキーワードです
,
,
,
,
,
研究制度:
>
>
>
研究所管機関:
前のページに戻る