特許
J-GLOBAL ID:200903044018877344

音声合成装置

発明者:
出願人/特許権者:
代理人 (1件): 宇井 正一 (外4名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-127275
公開番号(公開出願番号):特開平6-337700
出願日: 1993年05月28日
公開日(公表日): 1994年12月06日
要約:
【要約】【目的】 本発明は音声合成装置に関し、話者の音声に極めて類似した合成音を容易に生成することを目的とする。【構成】 話者の音声を入力する音声入力手段10と、入力音声を受け所定の音響セグメントネットワークに基づき入力音声を認識する認識処理手段11と、合成音の対象となる各単語に対応する音響セグメントネットワークを格納する音響セグメントネットワーク格納手段13と、入力音声の特徴と音響セグメントネットワークを比較判定し、比較結果により音響セグメントネットワークを更新し登録する音響セグメントネットワーク更新手段12と、話者の音声を文字列による単語として入力する文字入力手段14と、入力単語を音響セグメントネットワークに基づき所定の音声合成処理によって合成する合成処理手段15と、合成された音声を出力する合成音出力手段16とにより構成される。
請求項(抜粋):
話者の音声に類似した合成音を生成する音声合成装置であって、話者の音声を入力する音声入力手段(10)と、該音声入力手段からの入力音声を受け、所定の音響セグメントネットワークに基づき該入力音声を認識する認識処理手段(11)と、該合成音の対象となる各単語に対応する音響セグメントネットワークを格納する音響セグメントネットワーク格納手段(13)と、該入力音声の特徴を抽出し、該特徴と該音響セグメントネットワーク格納部に格納されている音響セグメントネットワークを比較判定し、比較結果による入力音声の特徴に基づき該音響セグメントネットワークを更新し登録する音響セグメントネットワーク更新手段(12)と、話者の音声を文字列による単語として入力する文字入力手段(14)と、該文字入力手段からの入力単語を、該音響セグメントネットワークに基づき所定の音声合成処理によって合成する合成処理手段(15)と、合成された音声を出力する合成音出力手段(16)とを備え、話者の音声の特徴を抽出し、その特徴を該音響セグメントネットワーク格納手段に格納した後、該文字入力手段から入力された文字列を所定の音声合成処理によって該合成処理手段が合成する際に、該音響セグメントネットワーク格納手段に格納されている更新された音響セグメントネットワークに従って、合成音を生成し、その結果、話者の音声に類似した合成音を生成するようにしたことを特徴とする音声合成装置。
IPC (2件):
G10L 9/18 ,  G10L 3/00 521

前のページに戻る