Pat
J-GLOBAL ID:200903044018877344
音声合成装置
Inventor:
Applicant, Patent owner:
Agent (1):
宇井 正一 (外4名)
Gazette classification:公開公報
Application number (International application number):1993127275
Publication number (International publication number):1994337700
Application date: May. 28, 1993
Publication date: Dec. 06, 1994
Summary:
【要約】【目的】 本発明は音声合成装置に関し、話者の音声に極めて類似した合成音を容易に生成することを目的とする。【構成】 話者の音声を入力する音声入力手段10と、入力音声を受け所定の音響セグメントネットワークに基づき入力音声を認識する認識処理手段11と、合成音の対象となる各単語に対応する音響セグメントネットワークを格納する音響セグメントネットワーク格納手段13と、入力音声の特徴と音響セグメントネットワークを比較判定し、比較結果により音響セグメントネットワークを更新し登録する音響セグメントネットワーク更新手段12と、話者の音声を文字列による単語として入力する文字入力手段14と、入力単語を音響セグメントネットワークに基づき所定の音声合成処理によって合成する合成処理手段15と、合成された音声を出力する合成音出力手段16とにより構成される。
Claim (excerpt):
話者の音声に類似した合成音を生成する音声合成装置であって、話者の音声を入力する音声入力手段(10)と、該音声入力手段からの入力音声を受け、所定の音響セグメントネットワークに基づき該入力音声を認識する認識処理手段(11)と、該合成音の対象となる各単語に対応する音響セグメントネットワークを格納する音響セグメントネットワーク格納手段(13)と、該入力音声の特徴を抽出し、該特徴と該音響セグメントネットワーク格納部に格納されている音響セグメントネットワークを比較判定し、比較結果による入力音声の特徴に基づき該音響セグメントネットワークを更新し登録する音響セグメントネットワーク更新手段(12)と、話者の音声を文字列による単語として入力する文字入力手段(14)と、該文字入力手段からの入力単語を、該音響セグメントネットワークに基づき所定の音声合成処理によって合成する合成処理手段(15)と、合成された音声を出力する合成音出力手段(16)とを備え、話者の音声の特徴を抽出し、その特徴を該音響セグメントネットワーク格納手段に格納した後、該文字入力手段から入力された文字列を所定の音声合成処理によって該合成処理手段が合成する際に、該音響セグメントネットワーク格納手段に格納されている更新された音響セグメントネットワークに従って、合成音を生成し、その結果、話者の音声に類似した合成音を生成するようにしたことを特徴とする音声合成装置。
IPC (2):
G10L 9/18
, G10L 3/00 521
Return to Previous Page