特許
J-GLOBAL ID:201903016203041159

音声合成のためのフロントエンドの学習方法、コンピュータプログラム、音声合成システム、及び音声合成のためのフロントエンド処理方法

発明者:
出願人/特許権者:
代理人 (1件): 清水 敏
公報種別:公開公報
出願番号(国際出願番号):特願2018-147162
公開番号(公開出願番号):特開2019-032529
出願日: 2018年08月03日
公開日(公表日): 2019年02月28日
要約:
【課題】リソースが限られている言語であっても効率よく学習が行える、深層学習を用いる音声合成のためのフロントエンドの学習方法を提供する。【解決手段】フロントエンドの学習方法は、DBRNNの基本ユニットを定義する情報等を記憶するステップ500と、DBRNNの学習のため、アノテート済文字列を記憶したデータベースに接続するステップ502と、アノテート済文字列に含まれる各文字を、固定長のGloVeベクトルにマッピングして文字ベクトル列を生成するステップ531と、アノテーションにしたがいラベルをワンホットベクトルに変換するステップ532と、複数のアノテート済文字列から生成された文字ベクトル列と、対応するラベル列との組み合わせを用いてDBRNNの基本ユニットのパラメータを教師あり学習により学習するステップ533〜538とを含む。言語は単独でも多言語でもよい。【選択図】図11
請求項(抜粋):
コンピュータが、ディープ双方向リカレントニューラルネットワーク(DBRNN)を生成する基本となる、予め設計されたリカレントニューラルネットワーク(RNN)からなる基本ユニットを定義する情報及び当該基本ユニットにより表される関数を定義するパラメータの初期値を記憶するステップと、 コンピュータが、前記DBRNNの学習のため、各々が、音声合成に必要な言語学的特徴を表す複数種類のラベルのいずれかによりアノテートされた複数のアノテート済文字列を記憶したデータベースに接続するステップと、 コンピュータが、前記複数のアノテート済文字列に含まれる各文字を、文字の共起関係に基づいて生成された意味的ベクトル空間内の固定長の文字ベクトルにマッピングすることにより文字ベクトル列を生成するステップと、 コンピュータが、前記複数のアノテート済文字列から生成された前記文字ベクトル列と、当該文字ベクトル列に対応するラベル列との組み合わせを用いて、入力される文字列に対して、前記複数種類のラベルのうちで正しい確率が高いラベルを前記DBRNNが出力可能となるように、前記基本ユニットのパラメータを教師あり学習により学習するステップとを含む、音声合成のためのフロントエンドの学習方法。
IPC (3件):
G10L 13/08 ,  G10L 13/06 ,  G10L 13/10
FI (3件):
G10L13/08 110A ,  G10L13/06 230Z ,  G10L13/10 113B

前のページに戻る