研課題
J-GLOBAL ID:202104007986284876  研究課題コード:13412380

実環境に向けたマルチモーダル声質変換手法の研究開発

実施期間:2013 - 2013
実施機関 (1件):
研究責任者: ( , 工学部, 助教 )
研究概要:
本研究課題では、入力された音声(元話者)を別の人の音声(目標話者)に変換する「声質変換技術」と、音声・画像など複数の情報を統合的に処理する「マルチモーダル技術」を用いた、「マルチモーダル声質変換技術」の確立を目指した。これは、元話者の音声と画像(口唇動画像)を用いて、雑音下・実環境下でも音質の低下を抑えつつ、目標話者の音声に変換する技術である。実環境を想定した音響雑音や画像外乱を入力音声・画像に施し、従来の声質変換とマルチモーダル声質変換の比較実験を行った。結果、雑音環境下で従来手法より変換音声の音質が向上し、画像外乱に対しても頑健性を確認した。今後は実用化を見据え、マルチモーダル技術の高度化による音質改善と、モバイル端末への実装を行う。
研究制度:
研究所管機関:
国立研究開発法人科学技術振興機構

前のページに戻る