特許
J-GLOBAL ID:200903094468267829

音声合成方法および音声合成装置ならびに音声合成処理プログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 上柳 雅誉 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-248524
公開番号(公開出願番号):特開2002-062890
出願日: 2000年08月18日
公開日(公表日): 2002年02月28日
要約:
【要約】【課題】人間がごく自然に発話しているような話し方により近い合成音を得る。【解決手段】多数の音声波形データから抽出されたLSP時系列データと前記音声波形データに対応するテキストデータとを用いて学習された個々の音素ごとのHMMパラメータ(遷移確率と出力確率)を記憶するHMMパラメータ記憶部4と、ある音素に対するHMMを選択するHMM選択部31と、乱数を発生する乱数発生器33とを有し、ある処理対象の音素に対して選択されたHMMにおける予め学習された遷移確率と出力確率とを用い、当該HMMのある状態についてある乱数を用いてその状態遷移を求め、その求められた状態遷移における前記出力確率とある乱数を用いてLSP時系列データ34を得たのち、LSP補間部35で補間処理を行い、その補間処理後のLSP時系列データをその音素を表現するLSPパラメータとして用いる。
請求項(抜粋):
テキスト文字列を構文解析してその構文解析された合成単位ごとにその合成単位を表現するパラメータを用いて音声合成処理する音声合成方法において、多数の音声波形データからLSP(Line Spectrum Pair)時系列データを抽出し、そのLSP時系列データと前記音声データに対応するテキストデータとによって学習されたHMM(隠れマルコフモデル)パラメータを有するHMMを個々の合成単位ごとに生成し、前記ある合成単位に対し、その合成単位に対応するHMMを前記生成されたHMMの中から選択し、その選択されたHMMのHMMパラメータとある乱数を用いて当該HMMを駆動させ、それによって得られたLSP時系列データを前記合成単位を表現するパラメータとして用いることを特徴とする音声合成方法。
IPC (2件):
G10L 13/06 ,  G10L 19/06
FI (3件):
G10L 5/04 F ,  G10L 5/04 E ,  G10L 9/14 H
Fターム (2件):
5D045AA20 ,  5D045CB03

前のページに戻る