特許
J-GLOBAL ID:200903062132460818
声質変換装置および声質変換方法、並びに、プログラム記録媒体
発明者:
出願人/特許権者:
代理人 (1件):
青山 葆 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-100801
公開番号(公開出願番号):特開2001-282300
出願日: 2000年04月03日
公開日(公表日): 2001年10月12日
要約:
【要約】【課題】 変換先話者の発声負担を軽減し、精度の良い声質変換を行う。【解決手段】 非線形周波数軸スペクトルマッチング部8は、変換元話者のスペクトル包絡と変換先話者のスペクトル包絡とに関する周波数ワーピング関数を求める。周波数ワープ表メモリ9には、周波数ワーピング関数の「音素」,「類似音素」,「有声音区間/無声音区間」および「音声区間全体」毎の平均値を格納する。そして、声質変換時には、平均周波数ワーピング関数を用いて、変換元話者のスペクトル包絡を変換先話者のスペクトル包絡に変換する。こうして、精度の良い声質変換を行う。その際に、変換先話者の発声データ量が少ない場合には、「類似音素」,「有声音区間/無声音区間」等の平均周波数ワーピング関数を用いることによって、変換先話者の発声データ量が少ない場合でも対処することができ、変換先話者の発声負担を軽減できる。
請求項(抜粋):
第1話者の声質での音声を第2話者の声質での音声に変換する声質変換装置であって、上記第1話者が発声した第1音声から第1スペクトル包絡を抽出する一方、第2話者が発声した2音声から第2スペクトル包絡を抽出するスペクトル包絡抽出手段と、上記抽出された第1スペクトル包絡および第2スペクトル包絡を、音声単位のラベルを付与して格納する第1メモリ手段と、同一ラベルに関して、上記第1メモリに格納された上記第1スペクトル包絡と第2スペクトル包絡とに対して動的計画法を用いた非線形な周波数伸縮マッチングを行って、両スペクトル包絡の周波数軸の対応付けを表わす周波数ワーピング関数を求める非線形周波数軸スペクトルマッチング手段と、上記周波数ワーピング関数を、音声単位のラベルを付与して格納する第2メモリ手段と、指定された音声単位名の第1スペクトル包絡を上記第1メモリから読み出す一方、上記指定された音声単位名の周波数ワーピング関数を上記第2メモリから読み出して、この読み出された周波数ワーピング関数に基づいて、上記読み出された第1スペクトル包絡を第2話者に関するスペクトル包絡に変換するスペクトル包絡変換手段を備えたことを特徴とする声質変換装置。
IPC (4件):
G10L 21/04
, G10L 13/00
, G10L101:02
, G10L101:04
FI (4件):
G10L101:02
, G10L101:04
, G10L 3/02 A
, G10L 7/02 D
Fターム (2件):
引用特許: