特許
J-GLOBAL ID:200903099343256460
音素モデル学習用文リスト生成方法、生成装置、および生成プログラム
発明者:
,
,
出願人/特許権者:
代理人 (2件):
草野 卓
, 稲垣 稔
公報種別:公開公報
出願番号(国際出願番号):特願2003-042611
公開番号(公開出願番号):特開2004-252167
出願日: 2003年02月20日
公開日(公表日): 2004年09月09日
要約:
【課題】自動ラベリングに用いる音素モデルの学習に際して少ない音声データでより高精度な音素モデルを作成するに必要とされる、音声データの元となる読み上げ文を効率よく選択する音素モデル学習用文リスト生成方法、生成装置、および生成プログラムを提供する。【解決手段】充分な量の音素を含む文セットより成る元テキストデータベース1、音素個数カウント部3、音素個数順ソート部5、最少個数音素文リスト生成部7、学習効率計算部9、学習効率順文ソート部11、基準学習データ数分選択部13、既選択文音素個数カウント部15、基準学習データ数未満音素文リスト生成部17を具備する音素モデル学習用文リスト生成方法、生成装置、および生成プログラム。【選択図】 図1
請求項(抜粋):
音素の統計的音響モデルを学習する音素モデル学習用文リスト生成方法において、
所定の充分な量の音素および音素における環境その他のバリエーションを充分に含む文セットより成る元テキストデータベースを具備して、元テキストデータベースから各音素の個数をカウントして個数の個数リストを生成し、
個数リストの音素を個数順に並び替えた並び替えリストを生成し、
並び替えリストの中で個数の最も少ない最小個数音素を含む全ての文を最少個数音素文リストに並べ、
並び替えリストの中で個数の最も少ない最小個数音素を含む文リストの音素モデルの学習効率スコア、学習バリエーション効率を計算して効率計算文リストを生成し、ここで、
文の学習効率スコア=(個数が基準学習データ数未満である音素(最小個数音素を除く)の種類数/(当該文に含まれる全ての音素数)で計算され、
学習バリエーション効率スコア=(当該文に含まれる全ての音素の種類数)/(当該文に含まれる全ての音素数)で計算され、
効率計算文リストから供給される文を学習効率スコア順に並べ替え、学習効率スコアが同値の場合は学習バリエーション効率順に並べ替えた並べ替え文リストを生成し、
最小個数音素の個数が基準学習データ数に達するまで並べ替え文リストの上位から順に文を選択し、選択された選択文リストを生成し、
選択文リスト中に含まれる音素の個数を数えて既選択文音素個数リストを生成し、
並び替えリストの中で最小個数音素の次に個数の少ない音素について、既選択文音素個数リスト中に基準学習データ数に達していない場合、当該音素をも含む基準学習データ数未満音素文リストを生成する、ことを特徴とする音素モデル学習用文リスト生成方法。
IPC (2件):
FI (3件):
G10L3/00 521F
, G10L3/00 535Z
, G10L3/00 521B
Fターム (2件):
引用特許:
審査官引用 (2件)
-
特開昭63-137297
-
特開昭61-249182
引用文献:
前のページに戻る