特許
J-GLOBAL ID:201703016027811622

音声合成装置およびそのプログラム

発明者:
出願人/特許権者:
代理人 (3件): 特許業務法人磯野国際特許商標事務所 ,  磯野 道造 ,  多田 悦夫
公報種別:特許公報
出願番号(国際出願番号):特願2012-254293
公開番号(公開出願番号):特開2014-102380
特許番号:特許第6063218号
出願日: 2012年11月20日
公開日(公表日): 2014年06月05日
請求項(抜粋):
【請求項1】 複数のノードと各ノード間の接続を表すエッジとで構成され、前記ノードのそれぞれに置換可能なテキストデータと対応する複数の音声が割り当てられて全体として文章を形成することができる有向グラフを使用して、入力された入力文に対応した音声を合成する音声合成装置であって、 複数の前記有向グラフを蓄積するグラフ群蓄積手段と、 前記入力文と、前記グラフ群蓄積手段に蓄積されている有向グラフとを比較することで、前記入力文と前記グラフ群蓄積手段に蓄積されているいずれかの有向グラフのノードにおけるテキストデータとの対応関係を得る入力文グラフ比較手段と、 前記有向グラフのノードに含まれるテキストデータを全て集めて一つのノードとし、開始ノードからのエッジと、終了ノードへのエッジを加えることで、前記開始ノード、前記一つのノード、前記終了ノードおよびこれらのノード間のエッジから構成される新たな有向グラフを生成するグラフ追加手段と、 前記入力文グラフ比較手段において一致する有向グラフがなかった場合に、前記入力文と、前記グラフ追加手段で生成された新たな有向グラフとを比較することで、前記入力文と前記新たな有向グラフのノードにおけるテキストデータとの対応関係を得る入力文追加グラフ比較手段と、 前記入力文グラフ比較手段または前記入力文追加グラフ比較手段において得られた前記対応関係を用いて、前記ノードにおけるテキストデータと対応付けられている音声について、当該音声と接続する前後の音声の接続部分における類似度が最大となる組み合わせを選択する音声選択手段と、 前記音声選択手段によって選択された音声の組み合わせを、前記入力文の構成順に接続する音声接続手段と、 を備えることを特徴とする音声合成装置。
IPC (2件):
G10L 13/08 ( 201 3.01) ,  G10L 13/06 ( 201 3.01)
FI (3件):
G10L 13/08 122 ,  G10L 13/06 210 C ,  G10L 13/08 123
引用特許:
出願人引用 (2件)

前のページに戻る