特許
J-GLOBAL ID:200903023071302283

学習装置および学習方法、認識装置および認識方法、並びに記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 稲本 義雄
公報種別:公開公報
出願番号(国際出願番号):特願平11-287617
公開番号(公開出願番号):特開2000-181484
出願日: 1999年10月08日
公開日(公表日): 2000年06月30日
要約:
【要約】【課題】 音声や画像などの異なる入力の特徴パラメータを、同等の重みで扱うことができるようにする。【解決手段】 仮正規化部53において、正規化係数制御部55からの正規化係数に基づいて、音声と画像の特徴パラメータそれぞれが正規化され、ベクトル量子化部54において、正規化された音声と画像の特徴パラメータそれぞれについて、ベクトル量子化が行われることにより、コードブックのコードベクトルとの距離が、量子化誤差として算出される。そして、正規化係数制御部55において、音声の特徴パラメータについての量子化誤差と、画像の特徴パラメータについての量子化誤差とが等しくなるように、正規化係数が変更される。
請求項(抜粋):
複数の入力データについて、それぞれの特徴を表す特徴パラメータの正規化に用いる正規化係数を求めるための学習を行う学習装置であって、前記正規化係数に基づいて、複数の特徴パラメータそれぞれを正規化する特徴パラメータ正規化手段と、正規化された前記複数の特徴パラメータそれぞれについて、所定の標準パラメータとの距離を算出する距離算出手段と、前記複数の特徴パラメータのうちの任意の1つについての距離と、他の任意の1つについての距離とが等しくなるように、前記正規化係数を変更する変更手段とを備えることを特徴とする学習装置。
IPC (7件):
G10L 15/20 ,  G10L 21/02 ,  G06F 15/18 560 ,  G10L 15/02 ,  G10L 15/24 ,  G10L 19/00 ,  G10L101:10
FI (5件):
G10L 3/02 301 A ,  G06F 15/18 560 G ,  G10L 3/00 515 B ,  G10L 3/00 571 Q ,  G10L 9/18 E
引用特許:
審査官引用 (5件)
  • 話者適応化方法および話者適応化装置
    公報種別:公開公報   出願番号:特願平8-053292   出願人:セイコーエプソン株式会社
  • 話者適応化方法
    公報種別:公開公報   出願番号:特願平6-021167   出願人:日本放送協会
  • 特開平1-259626
全件表示
引用文献:
前のページに戻る