特許
J-GLOBAL ID:201103084401439687

音素モデル学習用文リスト生成装置、および生成プログラム

発明者:
出願人/特許権者:
代理人 (4件): 中尾 直樹 ,  草野 卓 ,  中村 幸雄 ,  稲垣 稔
公報種別:特許公報
出願番号(国際出願番号):特願2003-042611
公開番号(公開出願番号):特開2004-252167
特許番号:特許第3981640号
出願日: 2003年02月20日
公開日(公表日): 2004年09月09日
請求項(抜粋):
【請求項1】 音素の統計的音響モデルを学習する音素モデル学習用文リスト生成装置において、 所定の充分な量の音素および音素における環境その他のバリエーションを充分に含む文セットより成る元テキストデータベースと、 元テキストデータベースから各音素の個数をカウントして個数リストを生成する音素個数カウント部と、 個数リストの音素を個数順に並び替えた並び替えリストを生成する音素個数順ソート部と、 前記並び替えリストの中で個数の最も少ない最少個数音素αを含む全ての文を前記元テキストデータベースから検索し、最少個数音素文リストに並べる最少個数音素文リスト生成部と、 前記最少個数音素文リストに含まれる各文について、音素モデルの学習効率スコア、学習バリエーション効率スコアを計算する学習効率計算部と、 前記最少個数音素文リストに含まれる各文を、前記学習効率スコア順に並べ替え、学習効率スコアが同値の場合は前記学習バリエーション効率スコア順に並べ替えた並べ替え文リストを生成する学習効率順文ソート部と、 前記最少個数音素の個数が基準学習データ数に達するまで前記並べ替え文リストの上位から順に文を選択し、選択された文を選択文リストに追加する基準学習データ数文選択部と、 前記選択文リスト中に含まれる音素の個数を数え、既選択文音素個数リストを生成する既選択文音素個数カウント部と、 前記並び替えリストの中で最少個数音素αの次に個数の少ない音素βについて、前記既選択文音素個数リスト中に前記基準学習データ数に達していない場合、前記基準学習データ数文選択部により選択された文を除き、前記元テキストデータベースから当該音素βを含む文を検索し、基準学習データ数未満音素文リストを生成する基準学習データ数未満音素文リスト生成部と、を具備し、 音素βを最少個数音素αとし、直前に基準学習データ数未満音素文リスト生成部で生成された基準学習データ数未満音素文リストを最少個数音素文リストとして、前記学習効率計算部に入力し、前記学習効率計算部、前記学習効率順文ソート部、前記基準学習データ数文選択部、前記既選択文音素個数カウント部、前記基準学習データ数未満音素文リスト生成部の各処理を繰り返し、 前記学習効率計算部は、 前記学習効率スコアを、 学習効率スコア=(個数が基準学習データ数未満である音素(最少個数音素αを除く)の種類数/(当該文に含まれる全ての音素数)で計算し、 前記学習バリエーション効率スコアを、 学習バリエーション効率スコア=(当該文に含まれる全ての音素の種類数)/(当該文に含まれる全ての音素数)で計算することを特徴とする音素モデル学習用文リスト生成装置。
IPC (1件):
G10L 15/06 ( 200 6.01)
FI (1件):
G10L 15/06 300 Y
引用特許:
出願人引用 (2件)
  • 特開昭63-137297
  • 特開昭61-249182
審査官引用 (2件)
  • 特開昭63-137297
  • 特開昭61-249182
引用文献:
前のページに戻る