特許
J-GLOBAL ID:201303081766971570

音声合成装置および音声合成プログラム

発明者:
出願人/特許権者:
代理人 (2件): 磯野 道造 ,  多田 悦夫
公報種別:公開公報
出願番号(国際出願番号):特願2011-265125
公開番号(公開出願番号):特開2013-117638
出願日: 2011年12月02日
公開日(公表日): 2013年06月13日
要約:
【課題】自然で肉声感のある音声を合成する音声合成装置および音声合成プログラムを提供する。【解決手段】音声合成装置1は、入力文を解析して音素ごとに分割する入力文解析手段30と、音素ごとに音声データの候補を列挙する音声データ候補列挙手段40と、音声データの候補の中から音響特徴量の差分の積算値が最小となる組み合わせを探索し、入力文に対応した音声データの組み合わせを決定する音声データ決定手段50と、入力文に対応する音響モデルの列を列挙する統計モデル列挙手段と、統計モデルを音声データの音響特徴量によって置き換えて統計モデルを修正する統計モデル修正手段60と、修正された統計モデルの列を平滑化して入力文に対応した音響特徴量の列として出力する音響特徴量列生成手段70と、生成された音響特徴量の列を音声波形に変換する音声波形変換手段80と、を備える。【選択図】図1
請求項(抜粋):
予め音声データの音響特徴量を音素ごとにモデル化した統計モデルを用いて、入力文に対応する音声を合成する音声合成装置であって、 前記入力文を解析し、前記統計モデルの単位である音素ごとに分割する入力文解析手段と、 前記入力文解析手段による解析結果に従って、前記音素ごとに、前記入力文に対応する音声データの候補を列挙する音声データ候補列挙手段と、 前記音声データ候補列挙手段によって列挙された前記音声データの候補の中から、音響特徴量の差分の積算値が最小となる組み合わせを探索することで、前記入力文に対応する音声データの組み合わせを決定する音声データ決定手段と、 前記入力文解析手段による解析結果に従って、前記音素ごとに、前記入力文に対応する前記統計モデルを列挙する統計モデル列挙手段と、 前記統計モデル列挙手段によって列挙された前記統計モデルを、前記音声データ決定手段によって決定された前記音声データの組み合わせから抽出した音響特徴量によって置き換えることで修正する統計モデル修正手段と、 前記統計モデル修正手段によって修正された前記統計モデルの列を平滑化し、前記入力文に対応する音響特徴量の列として出力する音響特徴量列生成手段と、 前記音響特徴量列生成手段によって生成された前記音響特徴量の列を音声波形に変換する音声波形変換手段と、 を備えることを特徴とする音声合成装置。
IPC (3件):
G10L 13/06 ,  G10L 13/00 ,  G10L 13/08
FI (3件):
G10L13/06 130 ,  G10L13/00 100K ,  G10L13/08 140
引用特許:
審査官引用 (4件)
全件表示

前のページに戻る