抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本稿では声質変換における深層学習技術について概説する。近年,深い構造のニューラルネットワークを用いた深層学習技術は,音声認識のみならず様々な分野で用いられており,大きな成果をあげている。声質変換は入出力の対応関係を如何にモデル化するかが本質であり,この対応関係を深層学習により学習する方法がいくつか提案されている。一方で声質変換においては,タスクの性質上,限られたデータを用いてシステムを構築する必要があり,この条件下で如何に深層学習を適切に用いるかが課題となる。本稿では深層学習に基づく声質変換の研究動向について述べるとともに,多人数話者データを用いたいくつかの取り組みについても紹介する。(著者抄録)