特許
J-GLOBAL ID:200903094295231955

テキスト選択方法、装置及びプログラム

発明者:
出願人/特許権者:
代理人 (2件): 草野 卓 ,  稲垣 稔
公報種別:公開公報
出願番号(国際出願番号):特願2003-036649
公開番号(公開出願番号):特開2004-246140
出願日: 2003年02月14日
公開日(公表日): 2004年09月02日
要約:
【課題】音声合成に用いる音声データベース作成に必要とする文(テキスト)の読上げ用文セットを効率的に生成する。【解決手段】文コーパス中の各文について、3連鎖音韻を基本単位とした基本素片の出現率の合計値をスコアとして計算する(ステップ1-1)。既に文セットに格納した基本素片を除き、かつ同一文中の複数の同一形態の基本素片の重複分はスコア計算に含めない。最高値スコアの文が1つであれば(ステップ1-4)これを文セットに格納、複数であればその複数文について、環境付き音節や環境付き形態素などの拡張素片単位とした各種の拡張素片の出現率の合計値をスコアとして先と同様な手法で計算する。同一文について各種の拡張素片スコアを荷重加算して複合スコアとし、複合スコアの最高値の文を文セットに格納する。荷重加算の重み係数の設定によりタスク依存度を高めることができる。【選択図】 図5
請求項(抜粋):
ディジタルデータとして記憶装置に格納されている文コーパス中の各テキストについて、音韻以上の長さを有するが短かい基本素片単位を用いて、一テキストに含まれる基本素片のうち、選択したテキスト中の基本素片の形態と同一のものを除いた異なる形態の数と対応する値を当該テキストのスコアとして求めて記憶部に格納する第一のステップと、 前記第一のステップで求めた全テキストのスコア中の最高値を有する一テキストを前記文コーパスから選択する第二のステップと、 前記第二のステップにおいて最高値のスコアのテキストが複数存在した場合に、前記基本素片単位より長い拡張素片単位を用いて、テキストに含まれる拡張素片のうち、選択したテキスト中の拡張素片の形態と同一のものを除いた異なる形態の数と対応する値を当該テキストのスコアとして求める処理を、前記第二のステップにおいて同一最高値のスコアであった各テキストに対し行ってその結果を記憶部に格納する第三のステップと、 前記第三のステップにおいて求めたスコア中の最高値を有する一テキストを前記文コーパスから選択する第四のステップと、 前記第四のステップにおいて最高値のスコアのテキストが複数存在した場合に、これらの中からテキスト長が最短である一テキストを選択する第五のステップと を有するテキスト選択方法。
IPC (1件):
G10L13/06
FI (3件):
G10L5/04 F ,  G10L5/04 C ,  G10L5/04 E
Fターム (1件):
5D045AA01
引用特許:
審査官引用 (4件)
全件表示
引用文献:
前のページに戻る