特許
J-GLOBAL ID:201103076338787057

音素符号変換装置、音素符号データベース、および音声合成装置

発明者:
出願人/特許権者:
代理人 (6件): 金山 聡 ,  深町 圭子 ,  伊藤 英生 ,  藤枡 裕実 ,  後藤 直樹 ,  伊藤 裕介
公報種別:公開公報
出願番号(国際出願番号):特願2010-041637
公開番号(公開出願番号):特開2011-180194
出願日: 2010年02月26日
公開日(公表日): 2011年09月15日
要約:
【課題】五線譜に変換可能な音声合成機能を実現する上で、日本語音節単位で取得したデータをより少ない数で構成可能な音素単位に変換する際に、子音音素成分と母音音素成分を時間軸上で明瞭に分離可能とする音素符号変換装置を提供する。【解決手段】音節波形データの各強度配列を時間軸方向に所定の倍率Qだけ拡大して周波数解析し、所定数P種類の周波数に対応したスペクトル強度を算出し、周波数、時刻を含むP個の符号コードを得て、P個の符号コードの周波数をQ倍、時刻を1/Q倍に補正した音節符号を得る。得た音節符号に対して、所定部分時間区間に含まれる各音高ごとに発音開始時刻と発音終了時刻との時間差と符号コードの強さとの積のエネルギー値の総和であるエネルギー総和値を算出し、複数の音節符号間で、後部に含まれる各音高ごとに全てのエネルギー総和値を乗算して統合エネルギー値を算出し、統合エネルギー値が高い上位の音高を抽出する。【選択図】図12
請求項(抜粋):
所定のサンプリング周波数でサンプリングされ、サンプル数Jで構成される音節波形データに対して、当該サンプリング周波数を維持しながら時間軸上でQ(Qは2以上の整数)倍拡大し、J×Qサンプルの拡大波形データに変換する音節波形拡大手段と、 前記拡大波形データに対して解析可能な最大周波数の1/Q以下の周波数の範囲で所定の周波数解析を行い、発音開始時刻、発音終了時刻、音高、強さのデータを備える複数の符号コードで表現した符号コード群を作成する符号コード群作成手段と、 前記符号コード群を構成する全ての符号コードの音高をQ倍に補正し、全ての符号コードの発音開始時刻と発音終了時刻を1/Q倍に補正し、補正された符号コード群で構成される音節符号を作成する音節符号作成手段と、 前記音節符号を構成する各符号コードについて、所定の部分時間区間に含まれる各音高ごとに発音開始時刻と発音終了時刻との時間差と符号コードの強さとの積で与えられるエネルギー値の総和であるエネルギー総和値を算出する音高別エネルギー算出手段と、 複数の音節符号間で、所定の部分時間区間に含まれる各音高ごとに全てのエネルギー総和値を乗算して統合エネルギー値を算出する音高別エネルギー統合手段と、 前記統合エネルギー値が高い上位の音高を所定の個数だけ抽出し、抽出された各音高に対応する符号コードに、所定の強さ、所定の発音開始時刻、所定の発音終了時刻のパラメータを設定し、複数の符号コードで構成される音素符号に変換する符号変換手段と、 を有することを特徴とする音素符号変換装置。
IPC (4件):
G10G 3/04 ,  G10H 1/00 ,  G10L 13/06 ,  G10L 19/00
FI (4件):
G10G3/04 ,  G10H1/00 Z ,  G10L13/06 250 ,  G10L19/00 220Z
Fターム (12件):
5D082BB01 ,  5D082BB06 ,  5D082BB13 ,  5D082BB14 ,  5D378AD21 ,  5D378AD63 ,  5D378AD67 ,  5D378KK02 ,  5D378KK07 ,  5D378QQ23 ,  5D378TT02 ,  5D378TT23
引用特許:
審査官引用 (2件)
引用文献:
前のページに戻る