特許
J-GLOBAL ID:200903002568403302

周囲環境適応標準パターン学習装置

発明者:
出願人/特許権者:
代理人 (1件): 京本 直樹 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平4-033824
公開番号(公開出願番号):特開平6-110490
出願日: 1992年02月21日
公開日(公表日): 1994年04月22日
要約:
【要約】【目的】 少数の話者が新しい周囲環境下で発声した学習データと、多数の話者がもとの周囲環境で発声した学習データとを用いて、認識性能を高める。【構成】 周囲環境条件aの下で発声したデータAと、条件aとは異なる周囲環境条件bの下で発声したデータBがあるとき、データA、Bとも発声している話者SPのデータAの発声データとデータAのみ発声した話者SQのデータAの発声データは対応づけ手段101に入力され、DPマッチングを用いて対応づけられる。写像作成手段102は対応づけられたデータの組から、話者SPから話者SQへの写像を作成する。学習データ作成手段103は作成された写像を用いて、話者SPのデータBから話者SQのデータBを推定し出力する。標準パターン学習手段104は話者SPのデータB、学習データ作成手段103で作成された話者SQのデータBを用いて標準パターンを学習する。
請求項(抜粋):
音声認識において、複数の話者の発声した学習データを用いて標準パターン学習する際に、第1の学習データ及びそれとは周囲環境の異なる第2の学習データをともに発声した話者の属する第1のグループと、前記第1の学習データは発声したが前記第2の学習データは発声していない話者の属する第2のグループがあるとき、第1のグループの話者の第1の学習データの要素と、第2のグループの話者の第1の学習データの要素とを、対応づける対応づけ手段と、前記対応づけ手段により対応づけられた第1のグループの話者の第1の学習データの要素と、第2グループの話者の第1の学習データの要素との組から、第1のグループの話者の第1の学習データの要素から第2のグループの話者の第1の学習データの要素への写像を作成する写像作成手段と、第2のグループの話者の第2の学習データを、第1のグループの話者の第2の学習データから、前記写像作成手段で作成した写像を用いて、作成する学習データ作成手段と、第1のグループの話者の第2の学習データと、学習データ作成手段において作成した第2のグループの話者の第2の学習データとを用いて、標準パターンを作成する標準パターン作成手段と、から構成されることを特徴とする周囲環境適応標準パターン学習装置。
IPC (4件):
G10L 3/00 521 ,  G10L 3/00 ,  G10L 3/00 533 ,  G10L 3/00 535

前のページに戻る