特許
J-GLOBAL ID:200903091644085334
音声処理装置及びその方法
発明者:
,
出願人/特許権者:
代理人 (4件):
蔦田 璋子
, 蔦田 正人
, 中村 哲士
, 富田 克幸
公報種別:公開公報
出願番号(国際出願番号):特願2006-011653
公開番号(公開出願番号):特開2007-193139
出願日: 2006年01月19日
公開日(公表日): 2007年08月02日
要約:
【課題】変換先話者の任意文の発声による声質変換規則作成を可能とする声質変換規則作成装置を提供する。【解決手段】変換元話者音声素片データベース11と声質変換規則学習データ作成部12と声質変換規則学習部13からなり声質変換規則14を作成し、声質変換規則学習データ作成部12は、変換先話者の音声素片抽出部21と属性作成部22、変換元話者音声素片データベース11、変換元話者音声素片選択部23から構成され、変換元話者音声素片選択部23は、前記変換先話者音声素片の属性情報と、変換元話者音声素片の属性情報との歪みに基づいて、変換先話者音声素片に対応する変換元話者音声素片が選択され、このように選択された変換先話者音声素片と、変換元話者音声素片の対から声質変換規則14を作成する。【選択図】 図1
請求項(抜粋):
変換元話者の複数の音声素片及び前記各音声素片に対応する元話者属性情報を保持する変換元話者音声記憶部と、
変換先話者の音声を、任意の音声単位に分割して先話者音声素片とする音声素片抽出部と、
前記変換先話者の音声またはその音声の言語情報から、前記各先話者音声素片に対応する先話者属性情報をそれぞれ求める属性作成部と、
前記先話者属性情報と前記元話者属性情報とに関するコストをコスト関数から算出し、前記コストより一または複数の音声素片を前記変換元話者音声記憶部から選択して、元話者音声素片とする変換元話者音声素片選択部と、
前記一または複数の元話者音声素片を前記先話者音声素片に変換するための声質変換関数を、前記先話者音声素片と前記一または複数の元話者音声素片に基づいて作成する声質変換規則作成部と、
を有する
ことを特徴とする音声処理装置。
IPC (2件):
FI (3件):
G10L21/04 120D
, G10L13/08 127F
, G10L13/08 127A
引用特許: