特許
J-GLOBAL ID:201103057729432453

音声合成方法、音声合成装置および音声合成プログラム

発明者:
出願人/特許権者:
代理人 (2件): 磯野 道造 ,  多田 悦夫
公報種別:特許公報
出願番号(国際出願番号):特願2003-296584
公開番号(公開出願番号):特開2004-139033
特許番号:特許第4532862号
出願日: 2003年08月20日
公開日(公表日): 2004年05月13日
請求項(抜粋):
【請求項1】 音素およびこの音素の発話時間を記憶している音声合成用データベースを用いて、入力されたテキストデータを音声合成する音声合成方法であって、 入力されたテキストデータを各音素に分割し、分割された音素に基本周波数を少なくとも含む情報である音韻韻律情報を付加し、音声合成する際の音素分割候補とする音素分割・音韻韻律情報付加ステップと、 この音素分割・音韻韻律情報付加ステップにて、音韻韻律情報が付加された音素分割候補の中から、当該音素分割候補の前後の調音結合に従った複数の音素分割候補からなる複数音素分割候補を探索単位とし、前記発話時間で区切られる音素に基づき、連結コストと音韻韻律コストとの和が最小になる音素分割候補を組み合わせた音声データ列として、前記音声合成用データベースからビタービサーチする音声データ探索ステップと、 この音声データ探索ステップにてビタービサーチされた前記音声データ列の各音素分割候補の連結部分および前記音韻韻律情報に基づいて予測された予測韻律と異なる韻律部分を、当該予測韻律を基準とする一定範囲に補正を行う音声データ補正ステップと、 この音声データ補正ステップにて補正を行った結果を音声合成データとして出力する音声合成データ出力ステップと、を含み、 前記音声データ探索ステップは、前記連結コストの算出に隠れマルコフモデルの分散値および平均値を複数音素分割候補の統計量として用いて各次元に正規化し、ケプストラム距離と前記基本周波数とを使用することを特徴とする音声合成方法。
IPC (1件):
G10L 13/06 ( 200 6.01)
FI (1件):
G10L 13/06 240 C
引用特許:
出願人引用 (10件)
全件表示
審査官引用 (10件)
全件表示
引用文献:
前のページに戻る