特許
J-GLOBAL ID:200903050201323765

音声合成装置および音韻継続時間長の制御方法

発明者:
出願人/特許権者:
代理人 (1件): 香取 孝雄
公報種別:公開公報
出願番号(国際出願番号):特願平11-121785
公開番号(公開出願番号):特開2000-310996
出願日: 1999年04月28日
公開日(公表日): 2000年11月07日
要約:
【要約】【課題】 リズム感がよく、より人間の発声に近い合成音を生成することのできる音声合成装置および音韻継続時間長の制御方法の提供。【解決手段】 音声合成装置10は、予測/学習制御部162bの制御により音韻継続時間長推定部166bで予測/学習の処理を行う。学習時にはこの制御によりアクセント句長とこのアクセント句長内の個々の音韻長の学習データを数量化1類モデルに適用して学習させ、この結果を格納する。予測時に音韻継続時間長設定部16b の要因算出部160bで算出された予測要因データと学習で得られた結果を用いてアクセント句長、音韻長がそれぞれ推定される。音韻継続時間長修正部168bでは、これら推定したアクセント句長内の個々の音韻の長さの総和を算出し、さらに、アクセント句長とこの算出した総和の値を用いて内挿補間し、得られた値を用いて個々の音韻長を修正して音韻長の制御を行っている。
請求項(抜粋):
供給されるテキストデータを解析し、得られた解析結果に基づいて音声合成の生成に用いる複数のパラメータをパラメータ生成手段で生成し、生成した複数のパラメータに対応する音声素片データが格納されるデータ格納手段から読み出して、これら複数のパラメータに応じた音声を合成する音声合成手段を介して出力する音声合成装置において、該装置は、あらかじめ前記パラメータ生成手段に供給されるテキストデータまたは該テキストデータを解析した解析データに所定の分類を行って予測要因データを求め、得られた予測要因データおよび該要因に対応する測定値を学習値とし統計モデルを用いた学習により複数の係数を生成保持させ、予測する際に前記予測要因データおよび前記複数の係数を前記統計モデルに用いて、所定のまとまりの長さを表す第1の制御単位長を第1のパラメータとし、該第1の制御単位長内の個々の音韻の長さを第2のパラメータとしてそれぞれのパラメータを推定する時間長推定手段と、該時間長推定手段で推定した第1の制御単位長が示す単位内の前記個々の音韻の長さの総和を第2の制御単位長として算出するとともに、前記第1の制御単位長と前記第2の制御単位長を用いて補間生成して、前記個々の音韻の長さを修正する時間長修正手段とを含むことを特徴とする音声合成装置。
IPC (2件):
G10L 13/06 ,  G10L 13/08
FI (2件):
G10L 5/04 F ,  G10L 3/00 H
Fターム (2件):
5D045AA09 ,  9A001HH18
引用特許:
審査官引用 (6件)
全件表示

前のページに戻る