声質変換における深層学習技術

齋藤大輔

文献

J-GLOBAL ID：201702260195124372 整理番号：17A0272333

声質変換における深層学習技術

Deep Learning in Voice Conversion

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=17A0272333&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=17A0272333&from=J-GLOBAL&jstjournalNo=S0532B") }}

著者 (1件)：
資料名：
巻： 116 号： 414(SP2016 65-76) ページ： 47-52 発行年： 2017年01月14日
JST資料番号： S0532B ISSN： 0913-5685 資料種別：会議録 (C)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

本稿では声質変換における深層学習技術について概説する。近年,深い構造のニューラルネットワークを用いた深層学習技術は,音声認識のみならず様々な分野で用いられており,大きな成果をあげている。声質変換は入出力の対応関係を如何にモデル化するかが本質であり,この対応関係を深層学習により学習する方法がいくつか提案されている。一方で声質変換においては,タスクの性質上,限られたデータを用いてシステムを構築する必要があり,この条件下で如何に深層学習を適切に用いるかが課題となる。本稿では深層学習に基づく声質変換の研究動向について述べるとともに,多人数話者データを用いたいくつかの取り組みについても紹介する。(著者抄録)

, , , ,
, , ,

音声処理

引用文献 (37件)：

前のページに戻る