特許
J-GLOBAL ID:200903002640836596

自然発話音声波形信号接続型音声合成装置

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-123822
公開番号(公開出願番号):特開平10-049193
出願日: 1997年05月14日
公開日(公表日): 1998年02月20日
要約:
【要約】【課題】 韻律制御規則を使わず、信号処理を実行することなく、任意の音素列を発声音声に変換することができ、自然に近い声質を得ることができる音声合成装置を提供する。【解決手段】 重み係数学習部11は特徴抽出された第1の音響的特徴パラメータに基づいて、同一の音素種類の1つの目標音素とそれ以外の音素候補との間の第2の音響的特徴パラメータにおける音響的距離を計算して統計的解析を行うことにより第2の音響的特徴パラメータにおける寄与度を表わす重み係数ベクトルを決定する。音声単位選択部12は入力される音素列に対して、目標音素と音素候補との間の近似コストを表わす目標コストと、隣接して連結されるべき2つの音素候補間の近似コストを表わす連結コストとを含むコストが最小となる音素候補列を検索してその索引情報を出力し、音声合成部13は索引情報に対応する音声波形信号の音声セグメントを逐次読み出して連結して音声合成する。
請求項(抜粋):
自然発話の音声波形信号の音声セグメントを記憶する第1の記憶手段と、上記第1の記憶手段によって記憶された音声波形信号の音声セグメントと、上記音声波形信号に対応する音素列とに基づいて、上記音声波形信号における音素毎の索引情報と、上記索引情報によって示された音素毎の第1の音響的特徴パラメータと、上記索引情報によって示された音素毎の韻律的特徴パラメータとを抽出して出力する音声分析手段と、上記音声分析手段から出力される索引情報と、上記第1の音響的特徴パラメータと、上記韻律的特徴パラメータとを記憶する第2の記憶手段と、上記第2の記憶手段によって記憶された第1の音響的特徴パラメータと韻律的特徴パラメータとに基づいて、同一の音素種類の1つの目標音素とそれ以外の音素候補との間の第2の音響的特徴パラメータにおける音響的距離を計算し、上記計算した音響的距離に基づいて各音素候補に対して上記第2の音響的特徴パラメータ毎に所定の統計的解析を実行することにより、各音素候補に対する上記第2の音響的特徴パラメータにおける寄与度を表わす各目標音素毎の重み係数ベクトルを決定する重み係数学習手段と、上記重み係数学習手段によって決定された上記第2の音響的特徴パラメータにおける各目標音素毎の重み係数ベクトルを記憶する第3の記憶手段と、上記第3の記憶手段によって記憶された各目標音素毎の重み係数ベクトルと、上記第2の記憶手段によって記憶された韻律的特徴パラメータとに基づいて、入力される自然発話文の音素列に対して、目標音素と音素候補との間の近似コストを表わす目標コストと、隣接して連結されるべき2つの音素候補間の近似コストを表わす連結コストとを含むコストが最小となる、音素候補の組み合わせを検索して、検索した音素候補の組み合わせの索引情報を出力する音声単位選択手段と、上記音声単位選択手段から出力される索引情報に基づいて、当該索引情報に対応する音声波形信号の音声セグメントを上記第1の記憶手段から逐次読み出して連結して出力することにより、上記入力された音素列に対応する音声を合成して出力する音声合成手段とを備えたことを特徴とする自然発話音声波形信号接続型音声合成装置。
IPC (2件):
G10L 5/04 ,  G10L 3/00 535
FI (2件):
G10L 5/04 F ,  G10L 3/00 535

前のページに戻る