特許
J-GLOBAL ID:200903067127677703

学習装置および学習方法、並びに認識装置および認識方法

発明者:
出願人/特許権者:
代理人 (1件): 稲本 義雄
公報種別:公開公報
出願番号(国際出願番号):特願平11-001789
公開番号(公開出願番号):特開2000-200098
出願日: 1999年01月07日
公開日(公表日): 2000年07月18日
要約:
【要約】【課題】 認識性能を向上させる。【解決手段】 画像と音声の特徴パラメータを、固定の正規化係数によって正規化して統合し、統合パラメータとした場合には、画像または音声の特徴パラメータそれぞれが、図17(A)または図17(B)に示すように、ある時刻において顕著な特徴を有する場合であっても、図17(C)に示すように、画像と音声の特徴パラメータどうしが相殺しあって、それぞれの顕著な特徴が失われることがある。そこで、図17(D)に示すように、画像と音声の時系列の特徴パラメータを、それぞれの特徴が失われない形で(最適な形で)統合して統合パラメータとすることができる時系列の正規化係数を用いて、統合パラメータが構成される。
請求項(抜粋):
複数の入力データについて、それぞれの特徴を表す時系列の特徴パラメータの正規化に用いる時系列の正規化係数を求めるための学習を行う学習装置であって、所定の学習用の正規化係数に基づいて、前記複数の入力データの特徴パラメータそれぞれを正規化する正規化手段と、正規化された複数の前記特徴パラメータそれぞれについて、所定の標準パラメータとの距離を算出する算出手段と、前記距離に基づき、時系列の前記特徴パラメータそれぞれについて、認識時に用いる時系列の前記正規化係数を決定する決定手段とを備えることを特徴とする学習装置。
IPC (5件):
G10L 21/02 ,  G06F 15/18 560 ,  G10L 15/06 ,  G10L 15/24 ,  G10L 15/02
FI (5件):
G10L 3/02 301 A ,  G06F 15/18 560 G ,  G10L 3/00 521 F ,  G10L 3/00 571 Q ,  G10L 5/06 A
Fターム (17件):
5D015EE01 ,  5D015FF05 ,  5D015GG05 ,  5D015LL07 ,  9A001BB02 ,  9A001BB03 ,  9A001BB04 ,  9A001EE05 ,  9A001EZ02 ,  9A001FF10 ,  9A001GZ05 ,  9A001HH07 ,  9A001HH16 ,  9A001HH17 ,  9A001HH23 ,  9A001KK37 ,  9A001KK46
引用特許:
審査官引用 (7件)
全件表示

前のページに戻る