特許
J-GLOBAL ID:200903016718829606

音声合成装置および音声合成プログラム

発明者:
出願人/特許権者:
代理人 (3件): 磯野 道造 ,  多田 悦夫 ,  古川 友美
公報種別:公開公報
出願番号(国際出願番号):特願2005-204289
公開番号(公開出願番号):特開2007-025042
出願日: 2005年07月13日
公開日(公表日): 2007年02月01日
要約:
【課題】 特定話者の音声データベースから特定話者以外の音声データベースに切り替える仕方を確立し、合成した合成音声の自然性の劣化を防止することができる音声合成装置および音声合成プログラムを提供する。【解決手段】 音声合成装置1は、特定話者が発声した音声から抽出した素片データからなる特定話者音声データベース3aと、予め設定した基準に従い前記音声に声質が類似する類似音声から抽出した素片データからなる類似声質音声データベース3bとを切り替えて用いて、音声合成を行うものであって、合成テキスト解析処理手段5と、特定話者素片選択処理手段7と、特定話者素片確認手段9と、複数話者素片選択処理手段11と、複数話者素片確認手段13と、合成音声選択手段15と、を備える。【選択図】 図1
請求項(抜粋):
特定話者が発声した音声から抽出した素片データからなる特定話者音声データベースと、前記音声に予め設定した基準により声質が類似するとした類似音声から抽出した素片データからなる類似声質音声データベースとを切り替えて用いて、音声合成を行う音声合成装置であって、 入力された、音声合成するテキストデータである合成テキストを解析して、当該合成テキストに含まれる素片に関する情報である素片情報を生成する合成テキスト解析処理手段と、 この合成テキスト解析処理手段で生成された素片情報と、前記素片データを接続した際の連続性をコストとして評価するためのコスト関数とを使用して、前記特定話者音声データベースに収められている素片データの選択を行い、選択した素片データに付されている素片番号と、選択した素片データを接続した場合の接続コストと、予め設定したコスト閾値情報とを含む選択素片情報を生成する特定話者素片選択処理手段と、 この特定話者素片選択処理手段で生成された選択素片情報と、予め設定した前記特定話者の素片データと声質が類似する素片データを示す声質類似リストとに基づいて、前記類似声質音声データベースに収められている素片データの選択を行い、選択した素片データに付されている素片番号と、選択した素片データを接続した場合の接続コストとを含む類似声質選択素片情報を生成する複数話者素片選択処理手段と、 前記特定話者素片選択処理手段で生成された選択素片情報に含まれる素片番号と、前記複数話者素片選択処理手段で生成された類似声質選択素片情報に含まれる素片番号との少なくとも一方の素片番号に基づいて、前記特定話者音声データベースと前記類似声質音声データベースとの少なくとも一方から素片データを読み出して接続し、接続した素片データを、音声合成された合成音声として出力する合成音声選択手段と、 を備えることを特徴とする音声合成装置。
IPC (1件):
G10L 13/06
FI (2件):
G10L13/06 240C ,  G10L13/06 230C
引用特許:
出願人引用 (3件)

前のページに戻る