特許
J-GLOBAL ID:200903072102106365
音声合成方法及び音声合成装置、音声合成プログラム
発明者:
,
,
出願人/特許権者:
代理人 (2件):
草野 卓
, 稲垣 稔
公報種別:公開公報
出願番号(国際出願番号):特願2002-289925
公開番号(公開出願番号):特開2004-126205
出願日: 2002年10月02日
公開日(公表日): 2004年04月22日
要約:
【課題】いかなる入力文章に対しても、人手に頼ることなく、新たに音声の録音や音声データベースとして整備するともなく、高品質な合成音声を生成する音声合成方法及び装置を提案する。【解決手段】入力されたテキストの読みや韻律と音声波形素片の関係を格納したテキストタグ付き音声素片データベースを用いて入力テキストに対応する音声波形素片を接続して音声信号を生成する。音声波形素片が示す読みや韻律情報との不一致度(コスト)により他の文字列への置換可能性を分析し、置換される音声波形素片を接続して合成音声を生成する。【選択図】 図1
請求項(抜粋):
入力された文章をテキスト解析して得られた読み、及び韻律情報に基づいて、音声素片データベースから複数の音声素片を選択し、選択された音声素片を接続することにより音声を合成する音声合成方法において、
入力文章をテキスト解析するテキスト解析過程と、
前記テキスト解析過程から得られた読み、及び韻律情報に基づいて、音声素片データベースから音声素片を検索する検索過程と、
前記テキスト解析過程から得られた読み、及び韻律情報と前記音声素片の有するコンテキスト及び韻律情報との不一致度を示す音声素片コスト及び、音声素片コストと音声素片の組み合わせから音声素片系列全体としての前記テキスト解析過程から得られた読み、及び韻律情報との不一致度を示す音声素片系列コストを計算するコスト計算過程と、
前記音声素片データベースから前記音声素片系列コストが最小となる音声素片を選択する音声素片選択過程と、
前記音声素片のコストの値によって置換対象とする音声素片候補を決定する音声素片置換候補判定過程と、
前記音声素片候補が対応する前記入力文章中の文字について、別の文字列に置換可能か判定する判定過程と、
前記判定過程で置換可能と判断された場合、前記置換対象とする音声素片の候補が対応する入力文章中の文字列を別の文字列に置換する置換過程と、
前記置換対象とする音声素片の候補が存在しかつ前記判定過程で置換可能と判定された場合、音声素片選択過程から置換過程までを繰り返す処理と、
前記置換対象とする音声素片の候補が存在しないかまたは前記判定過程で置換不可能と判定された場合、前記一連の過程において得られた音声素片のうち、音声素片系列コストが最小となる音声素片を選択し、それらの音声素片を接続することにより音声を合成する音声合成過程と、
を有することを特徴とする音声合成方法。
IPC (4件):
G10L13/08
, G10L13/06
, G10L15/10
, G10L15/18
FI (5件):
G10L3/00 H
, G10L5/04 F
, G10L3/00 537D
, G10L3/00 537F
, G10L3/00 531E
Fターム (5件):
5D015BB02
, 5D015HH04
, 5D015HH05
, 5D015HH07
, 5D045AA20
引用特許: