特許
J-GLOBAL ID:200903019420139444

音声合成方法、音声合成装置および音声合成プログラム

発明者:
出願人/特許権者:
代理人 (1件): 磯野 道造
公報種別:公開公報
出願番号(国際出願番号):特願2003-296584
公開番号(公開出願番号):特開2004-139033
出願日: 2003年08月20日
公開日(公表日): 2004年05月13日
要約:
【課題】 音声合成処理を高速にすると共に、音声合成した音声合成データを高品質に維持することができる音声合成方法、装置およびプログラムを提供する。【解決手段】 音素およびこの音素の発話時間を記憶している音声合成用データベース13を用いて、入力されたテキストデータを音声合成する音声合成装置1であって、入力部3と、単語音素分割・音韻韻律情報付加部5と、音声データベース探索部7と、音韻韻律補正部9と、出力部11と、を備えた。【選択図】 図1
請求項(抜粋):
音素およびこの音素の発話時間を記憶している音声合成用データベースを用いて、入力されたテキストデータを音声合成する音声合成方法であって、 入力されたテキストデータを各音素に分割し、分割された音素に基本周波数を少なくとも含む情報である音韻韻律情報を付加し、音声合成する際の音素分割候補とする音素分割・音韻韻律情報付加ステップと、 この音素分割・音韻韻律情報付加ステップにて、音韻韻律情報が付加された音素分割候補の中から、当該音素分割候補の前後の調音結合に従った複数の音素分割候補からなる複数音素分割候補を探索単位とし、前記発話時間で区切られる音素に基づき、連結コストおよび音韻韻律コストが最小になる音素分割候補を組み合わせた音声データ列として、前記音声合成用データベースから探索する音声データ探索ステップと、 この音声データ探索ステップにて探索された前記音声データ列の各音素分割候補の連結部分および前記音韻韻律情報に基づいて予測された予測韻律と異なる韻律部分を、当該予測韻律を基準とする一定範囲に補正を行う音声データ補正ステップと、 この音声データ補正ステップにて補正を行った結果を音声合成データとして出力する音声合成データ出力ステップと、 を含むことを特徴とする音声合成方法。
IPC (3件):
G10L13/08 ,  G10L13/00 ,  G10L13/06
FI (4件):
G10L3/00 H ,  G10L5/04 E ,  G10L5/04 F ,  G10L3/00 E
引用特許:
出願人引用 (10件)
全件表示
審査官引用 (10件)
全件表示
引用文献:
前のページに戻る