特許
J-GLOBAL ID:200903063086077946
音声合成の感情付与方法
発明者:
出願人/特許権者:
代理人 (1件):
三好 秀和 (外8名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-218710
公開番号(公開出願番号):特開平7-072900
出願日: 1993年09月02日
公開日(公表日): 1995年03月17日
要約:
【要約】【目的】 様々な感情表現に寄与する静的・動的音響パラメータを大量の音声資料の中から効率よく的確に抽出し、かつその抽出結果が音声合成時のパラメータ制御に直接利用し得るようにし、人手による変換規則の構築という労力をかけずに、任意に発声された無感情な自然音声や規則合成音声を感情を伴ったものに変換する。【構成】 音響的分析部2によって無感情な音声の音響的特徴パラメータと感情を伴った音声の音響的特徴パラメータとを抽出するとともに、ニューラルネットワーク部8によって前記無感情な音声の音響的特徴パラメータを感情を伴った音声の音響的特徴パラメータに変換するための学習を行なわせた後、学習済みの当該ニューラルネットワーク部8を用いて無感情な音声に感情を付与する。
請求項(抜粋):
学習時において、予め設定された言語で発声された無感情音声と、有感情音声とについて少なくとも声の高さ、大きさ、発声速度、スペクトルのいずれか1つ以上の音響的特徴パラメータを抽出するとともに、これら無感情音声と有感情音声との間の母音、子音の位置の対応をとりつつ、ニューラルネットワークの入力層に無感情音声の音響的特徴パラメータを与えながら、前記ニューラルネットワークの出力層に有感情音声の音響的特徴パラメータを与えることによって、これら無感情音声と有感情音声との間の音響的特徴パラメータの時間的な平均値または時間変化パターンの違いを学習させ、感情付与時において、合成対象となる音声の音響的特徴パラメータを前記ニューラルネットワークの入力層に入力して出力層から所望感情の音響的特徴パラメータを出力させ、この音響的特徴パラメータを用いて音声合成を行なう、ことを特徴とする音声合成の感情付与方法。
IPC (5件):
G10L 9/00
, G06F 15/18 560
, G10L 3/00
, G10L 3/00 531
, G10L 9/10 301
引用特許:
審査官引用 (5件)
-
特開平3-125200
-
特開平1-243169
-
特開平2-236600
-
特開平2-106799
-
特開昭58-168097
全件表示
前のページに戻る