特許
J-GLOBAL ID:200903094853036803

歌唱合成方法と装置及び記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 伊沢 敏昭
公報種別:公開公報
出願番号(国際出願番号):特願2002-052006
公開番号(公開出願番号):特開2003-255998
出願日: 2002年02月27日
公開日(公表日): 2003年09月10日
要約:
【要約】【課題】 自然な歌唱音声又は高品質の歌唱音声を合成する。【解決手段】 音素又は音素連鎖からなる音声素片に対応する音声波形を周波数分析して周波数スペクトル(A)を検出する。周波数スペクトル(A)上でP1等の局所的ピークを検知し、これらのピークを含むR1等のスペクトル分布領域を指定する。各スペクトル分布領域毎に、振幅スペクトル分布を周波数軸に関して表わす振幅スペクトルデータと、位相スペクトル分布を周波数軸に関して表わす位相スペクトルデータとを生成する。各スペクトル分布領域の振幅スペクトル分布を入力音符ピッチに応じて周波数軸上で(B)の様に移動すべく振幅スペクトルデータを修正し、この修正に対応して位相スペクトルデータを修正する。所望の音色に対応するスペクトル包絡に沿うようにスペクトル強度を調整する。修正された振幅及び位相スペクトルデータを時間領域の合成音声信号に変換する。
請求項(抜粋):
合成すべき音声の音声素片に対応する音声波形を周波数分析して周波数スペクトルを検出するステップと、前記周波数スペクトル上でスペクトル強度の局所的ピークを複数検知するステップと、各局所的ピーク毎に該局所的ピークとその前後のスペクトルとを含むスペクトル分布領域を前記周波数スペクトル上で指定し、各スペクトル分布領域毎に振幅スペクトル分布を周波数軸に関して表わす振幅スペクトルデータを生成するステップと、各スペクトル分布領域毎に位相スペクトル分布を周波数軸に関して表わす位相スペクトルデータを生成するステップと、前記合成すべき音声についてピッチを指定するステップと、各スペクトル分布領域毎に前記振幅スペクトルデータが表わす振幅スペクトル分布を前記ピッチに応じて周波数軸上で移動するように前記振幅スペクトルデータを修正するステップと、各スペクトル分布領域毎に前記位相スペクトルデータが表わす位相スペクトル分布を前記振幅スペクトルデータの修正に対応して修正するステップと、前記修正に係る振幅スペクトルデータ及び前記修正に係る位相スペクトルデータを時間領域の合成音声信号に変換するステップとを含む歌唱合成方法。
IPC (3件):
G10L 21/04 ,  G10L 13/00 ,  G10L 13/06
FI (3件):
G10L 3/02 A ,  G10L 5/04 F ,  G10L 3/00 J
Fターム (2件):
5D045AA07 ,  5D045BA10
引用特許:
審査官引用 (4件)
全件表示

前のページに戻る