特許
J-GLOBAL ID:200903079899714424

音声データベースにおける音素片情報最適化方法、及び音素片情報最適化装置

発明者:
出願人/特許権者:
代理人 (1件): 安富 耕二 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-248750
公開番号(公開出願番号):特開平11-085193
出願日: 1997年09月12日
公開日(公表日): 1999年03月30日
要約:
【要約】【課題】 従来の音声データベース最適化方法によってクラスタリング処理して音素片情報を削減したとしても、コンテキストクラスタテーブルには音声合成に際して全く使用されない音素片情報を多く含んだままの状態であるといった問題があった。【解決手段】 本発明は、文章発話から切り出した音素片を接続することにより合成音を得る波形合成に適用される音声データベースにおける音素片情報最適化方法において、予め学習用テキスト情報を用いて合成し、その合成結果に従って前記音声データベースを構成する各音素片情報の使用頻度を求め、該使用頻度に基づいてクラスタリング処理を行うことにより、音声ファイルの音素片情報を最適化する。
請求項(抜粋):
文章発話から切り出した音素片を接続することにより合成音を得る波形合成に適用される音声データベースにおける音素片情報最適化方法において、予め学習用テキスト情報を用いて合成し、その合成結果に従って前記音声データベースを構成する各音素片情報の使用頻度を求め、該使用頻度に基づいてクラスタリング処理を行うことにより、音声ファイルの音素片情報を最適化することを特徴とする音声データベースにおける音素片情報最適化方法。
IPC (3件):
G10L 5/04 ,  G10L 3/00 ,  G10L 9/18
FI (3件):
G10L 5/04 E ,  G10L 3/00 H ,  G10L 9/18 E
引用特許:
出願人引用 (2件)

前のページに戻る