特許
J-GLOBAL ID:201803020562317259

声質変換システム

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人スズエ国際特許事務所
公報種別:公開公報
出願番号(国際出願番号):特願2016-133530
公開番号(公開出願番号):特開2018-005048
出願日: 2016年07月05日
公開日(公表日): 2018年01月11日
要約:
【課題】アクターの声質をターゲットの声質に変換することを可能な声質変換システムを提供する。【解決手段】声質学習装置10は、ターゲット2の第1の音声信号から第1の特徴量を抽出する。声質学習装置10は、アクター1の第2の音声信号に含まれる基本周波数を所定の倍率で変換し、基本周波数が変換された第2の音声信号から第2の特徴量を抽出する。声質学習装置10は、抽出された第1の特徴量及び第2の特徴量間の対応関係をモデル化することによって得られるモデルデータをデータベースDBに格納する。声質変換装置20は、アクター1の第3の音声信号に含まれる基本周波数を所定の倍率で変換し、基本周波数が変換された第3の音声信号から第3の特徴量を抽出する。声質変換装置20は、データベースDBに格納されたモデルデータ及び抽出された第3の特徴量に基づいて、アクター1の声質がターゲット2の声質に変換された第4の音声信号を生成する。【選択図】図1
請求項(抜粋):
声質学習装置及び声質変換装置を備え、アクターの声質をターゲットの声質に変換する声質変換システムにおいて、 前記声質学習装置は、 前記ターゲットの第1の音声信号を入力する第1の入力手段と、 前記入力された第1の音声信号から第1の特徴量を抽出する第1の抽出手段と、 前記第1の音声信号に対応する前記アクターの第2の音声信号を入力する第2の入力手段と、 前記入力された第2の音声信号に含まれる基本周波数を所定の倍率で変換する第1の変換手段と、 前記基本周波数が変換された第2の音声信号から第2の特徴量を抽出する第2の抽出手段と、 前記抽出された第1の特徴量及び第2の特徴量間の対応関係をモデル化することによって得られるモデルデータを格納するデータベースと を含み、 前記声質変換装置は、 前記アクターの第3の音声信号を入力する第3の入力手段と、 前記入力された第3の音声信号に含まれる基本周波数を前記所定の倍率で変換する第2の変換手段と、 前記基本周波数が変換された第3の音声信号から第3の特徴量を抽出する第3の抽出手段と、 前記データベースに格納されたモデルデータ及び前記抽出された第3の特徴量に基づいて、前記アクターの声質が前記ターゲットの声質に変換された第4の音声信号を生成する生成手段と、 前記生成された第4の音声信号を出力する出力手段と を含む ことを特徴とする声質変換システム。
IPC (1件):
G10L 21/007
FI (1件):
G10L21/007
引用特許:
出願人引用 (2件)
引用文献:
前のページに戻る