Proj
J-GLOBAL ID:202104007986284876  Research Project code:13412380

実環境に向けたマルチモーダル声質変換手法の研究開発

実環境に向けたマルチモーダル声質変換手法の研究開発
Study period:2013 - 2013
Organization (1):
Research responsibility: ( , 工学部, 助教 )
Research overview:
本研究課題では、入力された音声(元話者)を別の人の音声(目標話者)に変換する「声質変換技術」と、音声・画像など複数の情報を統合的に処理する「マルチモーダル技術」を用いた、「マルチモーダル声質変換技術」の確立を目指した。これは、元話者の音声と画像(口唇動画像)を用いて、雑音下・実環境下でも音質の低下を抑えつつ、目標話者の音声に変換する技術である。実環境を想定した音響雑音や画像外乱を入力音声・画像に施し、従来の声質変換とマルチモーダル声質変換の比較実験を行った。結果、雑音環境下で従来手法より変換音声の音質が向上し、画像外乱に対しても頑健性を確認した。今後は実用化を見据え、マルチモーダル技術の高度化による音質改善と、モバイル端末への実装を行う。
Terms in the title (6):
Terms in the title
Keywords automatically extracted from the title.
Research program:
Organization with control over the research:
Japan Science and Technology Agency

Return to Previous Page