周囲環境適応標準パターン学習装置

発明者：
出願人/特許権者：
代理人 (1件)：京本直樹 (外2名)
公報種別：公開公報
出願番号（国際出願番号）：特願平4-033824
公開番号（公開出願番号）：特開平6-110490
出願日： 1992年02月21日
公開日（公表日）： 1994年04月22日
要約：

【要約】【目的】少数の話者が新しい周囲環境下で発声した学習データと、多数の話者がもとの周囲環境で発声した学習データとを用いて、認識性能を高める。【構成】周囲環境条件aの下で発声したデータAと、条件aとは異なる周囲環境条件bの下で発声したデータBがあるとき、データA、Bとも発声している話者SPのデータAの発声データとデータAのみ発声した話者SQのデータAの発声データは対応づけ手段101に入力され、DPマッチングを用いて対応づけられる。写像作成手段102は対応づけられたデータの組から、話者SPから話者SQへの写像を作成する。学習データ作成手段103は作成された写像を用いて、話者SPのデータBから話者SQのデータBを推定し出力する。標準パターン学習手段104は話者SPのデータB、学習データ作成手段103で作成された話者SQのデータBを用いて標準パターンを学習する。

請求項（抜粋）：

音声認識において、複数の話者の発声した学習データを用いて標準パターン学習する際に、第1の学習データ及びそれとは周囲環境の異なる第2の学習データをともに発声した話者の属する第1のグループと、前記第1の学習データは発声したが前記第2の学習データは発声していない話者の属する第2のグループがあるとき、第1のグループの話者の第1の学習データの要素と、第2のグループの話者の第1の学習データの要素とを、対応づける対応づけ手段と、前記対応づけ手段により対応づけられた第1のグループの話者の第1の学習データの要素と、第2グループの話者の第1の学習データの要素との組から、第1のグループの話者の第1の学習データの要素から第2のグループの話者の第1の学習データの要素への写像を作成する写像作成手段と、第2のグループの話者の第2の学習データを、第1のグループの話者の第2の学習データから、前記写像作成手段で作成した写像を用いて、作成する学習データ作成手段と、第1のグループの話者の第2の学習データと、学習データ作成手段において作成した第2のグループの話者の第2の学習データとを用いて、標準パターンを作成する標準パターン作成手段と、から構成されることを特徴とする周囲環境適応標準パターン学習装置。

IPC (4件)：

G10L 3/00 521 , G10L 3/00 , G10L 3/00 533 , G10L 3/00 535

前のページに戻る