特許
J-GLOBAL ID:202003011848530668
音響モデル学習装置、音響モデル学習方法、プログラム
発明者:
,
,
,
,
,
出願人/特許権者:
代理人 (3件):
中尾 直樹
, 中村 幸雄
, 義村 宗洋
公報種別:公開公報
出願番号(国際出願番号):特願2019-018478
公開番号(公開出願番号):特開2020-126141
出願日: 2019年02月05日
公開日(公表日): 2020年08月20日
要約:
【課題】少ない計算時間で一定の音声認識精度を有する音響モデルを学習する技術を提供する。【解決手段】音響モデルを用いて学習用コーパスCjの要素である音声データのロスを計算するロス計算部と、ロスが小さいことを示す所定の範囲にある音声データを要素とする学習用コーパスCjの部分集合の和であるカリキュラムコーパスを生成するカリキュラムコーパス生成部と、カリキュラムコーパスを用いて音響モデルを更新する音響モデル更新部と、所定の終了条件を満たす場合は音響モデルを出力し、所定の終了条件を満たさない場合はロス計算部に実行制御を移す第1終了条件判定部とを含む音響モデル学習装置であって、音響モデル更新部は、音声データがカリキュラムコーパスの要素として選定された回数が大きいほど小さくなるような音声データに対する重みを用いて、カリキュラムコーパスの要素である音声データに対する勾配を重み付けして音響モデルを更新する。【選択図】図1
請求項(抜粋):
Jを1以上の整数、Cj(j=1, ..., J)を音声データの集合である学習用コーパスとし、
学習用コーパスCj(j=1, ..., J)に対して、音響モデルθを用いて学習用コーパスCjの要素である音声データのロスを計算するロス計算部と、
前記ロスが小さいことを示す所定の範囲にある音声データを要素とする学習用コーパスCj(j=1, ..., J)の部分集合の和であるカリキュラムコーパスCを生成するカリキュラムコーパス生成部と、
カリキュラムコーパスCを用いて、音響モデルθを更新する音響モデル更新部と、
所定の終了条件を満たす場合は音響モデルθを出力し、前記所定の終了条件を満たさない場合は前記ロス計算部に実行制御を移す第1終了条件判定部と、
を含む音響モデル学習装置であって、
前記音響モデル更新部は、
音声データがカリキュラムコーパスの要素として選定された回数nが大きいほど小さくなるような音声データに対する重みwを用いて、カリキュラムコーパスCの要素である音声データに対する勾配を重み付けして、音響モデルθを更新する
音響モデル学習装置。
IPC (2件):
FI (3件):
G10L15/06 300Y
, G10L15/06 300D
, G10L15/16
前のページに戻る