Pat
J-GLOBAL ID:200903047623042857

自然発話音声波形信号接続型音声合成装置

Inventor:
Applicant, Patent owner:
Agent (1): 青山 葆 (外2名)
Gazette classification:公開公報
Application number (International application number):1997048769
Publication number (International publication number):1998247097
Application date: Mar. 04, 1997
Publication date: Sep. 14, 1998
Summary:
【要約】【課題】 従来例に比較してより自然なイントネーションで音声合成することができる音声合成装置を提供する。【解決手段】 重み係数学習部11は特徴抽出された第1の音響的特徴パラメータに基づいて、同一の音素種類の1つの目標音素とそれ以外の音素候補との間の第2の音響的特徴パラメータにおける音響的距離を計算して線形回帰分析することにより第2の音響的特徴パラメータにおける寄与度を表わす重み係数ベクトルを決定する。音声単位選択部12は入力される音素列に対して、目標音素と音素候補との間の近似コストを表わす目標コストと、隣接して連結されるべき2つの音素候補間の近似コストを表わす連結コストとを含むコストが最小となる音素候補列を検索してその索引情報を出力し、音声合成部13は索引情報に対応する音声波形信号の音声セグメントを逐次読み出して連結して音声合成する。ここで、目標コストにF0パターンの傾きの差を追加する。
Claim (excerpt):
自然発話の音声波形信号の音声セグメントを記憶する第1の記憶手段と、上記第1の記憶手段によって記憶された音声波形信号の音声セグメントと、上記音声波形信号に対応する音素列とに基づいて、上記音声波形信号における音素毎の索引情報と、上記索引情報によって示された音素毎の第1の音響的特徴パラメータと、上記索引情報によって示された音素毎の第1の韻律的特徴パラメータとを抽出して出力する音声分析手段と、上記音声分析手段から出力される索引情報と、上記第1の音響的特徴パラメータと、上記第1の韻律的特徴パラメータとを記憶する第2の記憶手段と、上記第2の記憶手段によって記憶された第1の音響的特徴パラメータに基づいて、同一の音素種類の1つの目標音素とそれ以外の音素候補との間の第2の音響的特徴パラメータにおける音響的距離を計算し、計算した音響的距離に基づいて上記第2の音響的特徴パラメータにおいて線形回帰分析することにより、各音素候補に関する上記第2の音響的特徴パラメータにおける寄与度を表わす各目標音素毎の重み係数ベクトルを決定する重み係数学習手段と、上記重み係数学習手段によって決定された上記第2の音響的特徴パラメータにおける各目標音素毎の重み係数ベクトルと、予め与えられた、各音素候補に関する第2の韻律的特徴パラメータにおける寄与度を表わす各目標音素毎の重み係数ベクトルとを記憶する第3の記憶手段と、上記第3の記憶手段によって記憶された各目標音素毎の重み係数ベクトルと、上記第2の記憶手段によって記憶された第1の韻律的特徴パラメータとに基づいて、入力される自然発話文の音素列に対して、目標音素と音素候補との間の近似コストを表わす目標コストと、隣接して連結されるべき2つの音素候補間の近似コストを表わす連結コストとを含むコストが最小となる、音素候補の組み合わせを検索して、検索した音素候補の組み合わせの索引情報を出力する音声単位選択手段と、上記音声単位選択手段から出力される索引情報に基づいて、当該索引情報に対応する音声波形信号の音声セグメントを上記第1の記憶手段から逐次読み出して連結して出力することにより、上記入力された音素列に対応する音声を合成して出力する音声合成手段とを備え、上記音声単位選択手段は、目標音素の音声基本周波数F0と音素候補の音声基本周波数F0との傾きの差を目標コストに加算することを特徴とする自然発話音声波形信号接続型音声合成装置。
IPC (2):
G10L 5/04 ,  G10L 3/00
FI (2):
G10L 5/04 F ,  G10L 3/00 H

Return to Previous Page