特許
J-GLOBAL ID:200903068411233692

音声合成装置および音声合成方法、並びに、プログラム記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2001-261327
公開番号(公開出願番号):特開2003-066982
出願日: 2001年08月30日
公開日(公表日): 2003年03月05日
要約:
【要約】【課題】 少ない音声素片データ容量と少ない処理量とで複数声質に対応する。【解決手段】 素片記憶部3には、音声素片のスペクトル形状をLPCやLPC係数やLSP係数として保持してデータ容量の削減を図る。声質変換部5のLSP係数変形部は、素片選択部4で選択された音声素片のLSP係数を、声質変換パラメータ入部2からの声質変換パラメータk,pに応じた度合と方向とで線形型または非線型の周波数変換を少ない処理量で行う。声質変換部5のLSP次数変換部は、線形変換でk>1の場合には、ナイキスト周波数πよりも大きくなった次数のLSP係数を削除する。こうして、合成フィルタの安定性が損なわれないようにする。また、非線形変換でp<1の場合には、pに基づく個分だけ高次数側のLSP係数を削除する。こうして、高周波数領域が不自然に強調されたり合成フィルタの動作が不安定になるのを防止する。
請求項(抜粋):
少なくともテキスト情報あるいは音素情報が入力されるテキスト入力手段と、声質変換パラメータが入力される声質変換パラメータ入力手段と、音声素片データが格納される素片記憶手段と、入力されたテキスト情報または音素情報に応じて上記音声素片データを選択する素片選択手段と、上記選択された音声素片データの声質を入力された声質変換パラメータに応じて変換する声質変換手段と、声質が変換された音声素片データに基づいて音声波形を合成する波形合成手段を有する音声合成装置において、上記素片記憶手段に記憶されている音声素片データは線スペクトル対係数あるいは線スペクトル対に変換可能なスペクトル情報であり、上記声質変換手段は、上記入力された声質変換パラメータに応じて、上記選択された音声素片から求められる線スペクトル対係数を周波数方向に線形にあるいは非線形に拡張あるいは伸縮して、ホルマント位置を周波数方向に移動することによって声質を変化させる係数変形手段を備えていることを特徴とする音声合成装置。
IPC (2件):
G10L 13/00 ,  G10L 13/06
FI (3件):
G10L 7/02 D ,  G10L 9/02 L ,  G10L 5/04 F
Fターム (1件):
5D045AA20
引用特許:
審査官引用 (5件)
全件表示

前のページに戻る