特許
J-GLOBAL ID:200903024766224859

音声ファイル構成方式及び方法

発明者:
出願人/特許権者:
代理人 (1件): 上村 輝之
公報種別:公開公報
出願番号(国際出願番号):特願平7-091616
公開番号(公開出願番号):特開平8-263520
出願日: 1995年03月24日
公開日(公表日): 1996年10月11日
要約:
【要約】【目的】 音素波形を接続して合成音を得る波形合成に適用される音声ファイルの構成方式において、コンテキスト及び韻律の双方において網羅性の高い音声ファイルを構成できるようにする。【構成】 音声データベースに蓄積された音声波形データから、まず、同一の音素ラベルをもつ波形データを切出し、初期クラスタ110とする。次に、この初期クラスタ110に対し、コンテキストをベースとして所定の特徴パラメータ空間上でクラスタリングを行う。次に、このコンテキストクラスタリングで得られた各クラスタ130、140、150に対し、所定の韻律パラメータ空間上でクラスタリングを行う。最後に、この韻律クラスタリングで得られた細かいクラスタ131〜133、141〜143、151〜153の各々から、そのセントロイドに最も近い波形データを抽出し、合成用音声ファイル160に登録する。
請求項(抜粋):
自然発声から切出した音声波形素片を組合わせることにより合成音を得る波形合成に利用される音声ファイルの構成方式において、前記自然発声から切出した多数の音声波形素片を蓄積した音声データベースと、前記音声データベース内の同一音素をもつ音声波形素片の集合に対し、所定の特徴パラメータ空間においてコンテキストをベースとしたコンテキストクラスタリングを行うコンテキストクラスタリング手段と、前記コンテキストクラスタリングにより得られた個々のクラスタに対し、所定の韻律パラメータ空間における韻律クラスタリングを行う韻律クラスタリング手段と、前記韻律クラスタリングにより得られた個々のクラスタのセントロイドを求め、このセントロイドの近傍にある音声波形素片を抽出し、前記音声ファイルに登録する音声素片登録手段と、を備えることを特徴とする音声ファイル構成方式。
IPC (3件):
G06F 17/30 ,  G10L 3/00 521 ,  G10L 5/04
FI (4件):
G06F 15/40 370 E ,  G10L 3/00 521 E ,  G10L 5/04 E ,  G06F 15/403 350 Z
引用特許:
審査官引用 (3件)
  • 波形編集型音声合成装置
    公報種別:公開公報   出願番号:特願平5-049321   出願人:日本電信電話株式会社
  • 特開平1-284898
  • 特開昭62-217292

前のページに戻る