特許
J-GLOBAL ID:201003032551516631

声質変換音声生成装置および声質変換音声生成システム

発明者:
出願人/特許権者:
代理人 (1件): 新居 広守
公報種別:公開公報
出願番号(国際出願番号):特願2008-174006
公開番号(公開出願番号):特開2010-014913
出願日: 2008年07月02日
公開日(公表日): 2010年01月21日
要約:
【課題】パラレルコーパスを必要とせず、基本周波数が変化する範囲、パワーが変化する範囲、持続時間あるいは音楽表現に伴って声質が変化する範囲が非常に広い歌唱音声に適用可能な声質変換音声生成装置を提供する。【解決手段】音韻種類毎に音域を示す声質属性情報が付加された目標音声の声質パラメータを記憶している声質属性情報付声質パラメータ記憶部110と、各々が入力音声の時間軸上の範囲に対応付けられた音韻種類および音域を含む入力音声の声質属性情報と、入力音声の声質を示す声質パラメータとを取得し、入力音声の時間軸上の範囲毎に、当該範囲に含まれる入力音声の声質属性情報と一致する声質属性情報が付加された目標音声の声質パラメータを取得し、目標音声の声質パラメータと、入力音声の声質パラメータとを用いて、声質パラメータを合成する元歌データ入力部100およびパラメータ変換部120とを備える。【選択図】図1
請求項(抜粋):
入力音声の声質を変換する声質変換音声生成装置であって、 各々が入力音声の時間軸上の範囲に対応付けられた音韻種類および音域を含む入力音声の声質属性情報と、入力音声の声質を示す声質パラメータとを取得する入力音声声質パラメータ取得部と、 音韻種類毎に音域を示す声質属性情報が付加された目標音声の声質パラメータを記憶している声質パラメータ記憶部と、 前記入力音声の時間軸上の範囲毎に、当該範囲に含まれる前記入力音声の声質属性情報と一致する声質属性情報が付加された目標音声の声質パラメータを前記声質パラメータ記憶部より取得する目標音声声質パラメータ取得部と、 前記目標音声声質パラメータ取得部が取得した目標音声の声質パラメータと、前記入力音声声質パラメータ取得部で取得された入力音声の声質パラメータとを用いて、声質パラメータを合成する声質パラメータ合成部と、 前記声質パラメータ合成部で合成された前記声質パラメータに基づいて、音声波形を合成する音声合成部と を備える声質変換音声生成装置。
IPC (4件):
G10L 21/04 ,  G10L 11/04 ,  G10L 11/00 ,  H04M 11/08
FI (6件):
G10L21/04 120D ,  G10L11/04 ,  G10L11/00 101A ,  G10L11/00 101G ,  G10L21/04 200B ,  H04M11/08
Fターム (6件):
5K201BA05 ,  5K201BA18 ,  5K201CB17 ,  5K201EC06 ,  5K201ED04 ,  5K201EF08
引用特許:
出願人引用 (1件)

前のページに戻る