特許
J-GLOBAL ID:200903006238552137

綴り言葉に対する複数発音を生成し評価する判断ツリ-を利用する方法及び装置

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-121710
公開番号(公開出願番号):特開平11-344990
出願日: 1999年04月28日
公開日(公表日): 1999年12月14日
要約:
【要約】【課題】 綴り言葉の発音を自動生成する。【解決手段】 混合判断ツリーは、綴り言葉シーケンス中の近接文字と、綴り言葉シーケンスに対応する音素シーケンス中の近接音素とに関する、イエス・ノー質問のネットワークを含む。混合判断ツリーのリーフ・ノードは、音声転写が最も相応しい情報を与える。混合ツリーを利用して、スコアは可能性ある複数の発音の各々に対して生成されるのであり、これらスコアは、確率順に発音を分類するだけでなく、最も相応しい発音を選択するのに用いることができる。システムにより生成された発音は、辞書編集アプリケーションだけでなく、音声合成や音声認識のアプリケーションにて、用いることができる。
請求項(抜粋):
予め決められたアルファベットから選択された入力文字シーケンスに対する少なくとも1つの音声発音を生成する装置であって、上記アルファベットに対応する複数の文字のみの判断ツリーを蓄えるメモリと、所与のシーケンスの所与の文字及びその近接の文字に関するイエス・ノー質問を表す内部ノードを備える上記文字のみの判断ツリーと、上記アルファベットに対応する複数の混合判断ツリーをさらに蓄える上記メモリと、上記所与のシーケンスの所与の文字及びその近接の文字に関するイエス・ノー質問を表す第1の複数の内部ノードと、上記所与のシーケンスの音素及びその近接の音素に関するイエス・ノー質問を表す第2の複数の内部ノードとを備える、上記混合判断ツリーと、上記所与の文字を複数の音素発音と関連付ける確率データを示すリーフ・ノードを、さらに備える、上記文字のみの判断ツリー及び上記混合判断ツリーと、上記文字のみの判断ツリーに結合され、入力文字シーケンスを処理し該入力文字シーケンスに対応する音声発音の第1のセットを生成する、音素シーケンス生成部と、上記混合判断ツリーに結合され、上記第1のセットを処理し、上記入力シーケンスの少なくとも1つの音声音素を示すスコア付き音声音素の第2のセットを生成する、スコア評価部と、を備えることを特徴とする音声発音生成装置。
IPC (2件):
G10L 3/00 ,  G10L 3/00 521
FI (2件):
G10L 3/00 H ,  G10L 3/00 521 F
引用特許:
出願人引用 (1件)
  • 音声合成装置
    公報種別:公開公報   出願番号:特願平8-039981   出願人:三洋電機株式会社

前のページに戻る