特許
J-GLOBAL ID:200903021462332508

音声合成方法および音声合成装置

発明者:
出願人/特許権者:
代理人 (1件): 志村 浩
公報種別:公開公報
出願番号(国際出願番号):特願平9-273950
公開番号(公開出願番号):特開平11-095798
出願日: 1997年09月19日
公開日(公表日): 1999年04月09日
要約:
【要約】【課題】 人間の音声を効率良く、かつ、音長や音程の自由度をもって合成する。【解決手段】 基本50音,濁音,拗音などの音素について、アナウンサーに基本音長,基本音程で発音してもらい、発音波形をPCMデータとして取り込む。1つの音素についての発音波形の時間軸上に複数の単位区間d1,d2,...を定義し、各単位区間ごとの発音波形をフーリエ変換し、4つの代表周波数を抽出し、これに対応する4つのMIDIデータを定義する。定義した4つのMIDIデータは、4つのトラックT1〜T4に配置する。単位区間d1〜d9についてのMIDIデータを、位置K1〜K9に配置し、母音に寄与するデータと子音に寄与するデータとに分類する。音長,音程を指定して特定の音素を再生する際に、母音に寄与するMIDIデータに対して、音長(デルタタイム)および音程(ノートナンバー)の補正を行い再生する。
請求項(抜粋):
特定の音素に対応する人間の声を合成する方法であって、1つの音素について人間の発音波形をデータとして取り込み、この発音波形の時間軸上に複数の単位区間を設定し、個々の単位区間ごとに当該単位区間内の発音波形に含まれる代表周波数およびその強度を示す符号コードを作成し、前記1つの音素に対応する符号コード群を定義する符号コード定義処理を、必要な各音素についてそれぞれ行い、各音素について定義された符号コード群をそれぞれ記録した音素符号テーブルを用意し、特定の音素に対応する人間の声を合成する合成指示が与えられたときに、前記音素符号テーブルを参照することにより、前記特定の音素について定義された符号コード群を抽出し、抽出した符号コード群を所定の音源を用いて再生することにより人間の声を合成することを特徴とする音声合成方法。
IPC (5件):
G10L 5/04 ,  G10H 1/00 ,  G10H 7/02 ,  G10L 3/00 ,  G10L 5/02
FI (5件):
G10L 5/04 F ,  G10H 1/00 Z ,  G10L 3/00 H ,  G10L 5/02 J ,  G10H 7/00 521 Z

前のページに戻る