特許
J-GLOBAL ID:200903012487042270

音声認識装置における辞書更新方式

発明者:
出願人/特許権者:
代理人 (1件): 京谷 四郎
公報種別:公開公報
出願番号(国際出願番号):特願平5-055541
公開番号(公開出願番号):特開平6-266385
出願日: 1993年03月16日
公開日(公表日): 1994年09月22日
要約:
【要約】【目的】 話者の発声状態の変動しても高い認識率を維持できるようにするとともに、歪んだ音声パターンが辞書に登録されることを避けること。【構成】 音声パターン照合手段3は音響分析手段2で特徴が抽出された入力音声パターンと、辞書4のテンプレートとのスコア、および、入力音声パターン保持手段6に保持されている直前の正解入力音声パターンとのスコアを求める。認識結果判定手段5は上記スコアに基づき認識結果を出力する。また、認識結果が正しくない場合、ユーザ入力手段9により入力音声パターンに正解ラベルを付与する。照合結果判定手段8は、辞書4と正解入力音声パターン間のスコアと、入力音声パターン保持手段6の正解音声パターンと上記入力音声パターン間のスコアを比較する。辞書更新手段7は上記比較結果に基づき辞書4の更新を行う。
請求項(抜粋):
音声入力手段(1) より入力された未知入力音声を音響分析する音響分析手段(2) と、音響分析手段(2) により得られた入力音声パターンと、予め辞書(4) 中に登録された各ラベルに対応した標準音声パターンとを照合する音声パターン照合手段(3) と、その照合結果に基づき、認識結果を得る認識結果判定手段(5) と、入力音声パターンに正解のラベルを付与するユーザ入力手段(9) と、入力音声パターンにより辞書(4) を更新する辞書更新手段(7) とを備えた音声認識装置において、入力音声パターンを一時的に保持する入力音声パターン保持手段(6) を設け、認識結果が正解であった入力音声パターン、もしくは、認識時にユーザ入力手段(9) により正解ラベルが付与された入力音声パターンについて、音声パターン照合手段(3) において、入力音声パターンと辞書(4) に登録された各正解標準音声パターンとを照合するとともに、入力音声パターン保持手段(6) に、上記入力音声パターンと同じラベルが付された正解音声パターンが保持されている場合に、上記入力音声パターンと入力音声パターン保持手段(6) に保持された音声パターンとを照合し、上記入力音声パターンと入力音声パターン保持手段(6) に保持された音声パターンの類似度が、上記入力音声パターンと辞書(4) に登録された標準音声パターンとの類似度より大きい場合に、入力音声パターン保持手段(6) に保持された音声パターンを辞書(4) に登録し、辞書(4) の標準音声パターンを削除することを特徴とする音声認識装置における辞書更新方式。
IPC (2件):
G10L 3/00 521 ,  G10L 3/00 561
引用特許:
審査官引用 (6件)
  • 特開昭59-165100
  • 特開昭59-165100
  • 特開昭59-165100
全件表示

前のページに戻る