Pat
J-GLOBAL ID:200903067127677703
学習装置および学習方法、並びに認識装置および認識方法
Inventor:
,
Applicant, Patent owner:
Agent (1):
稲本 義雄
Gazette classification:公開公報
Application number (International application number):1999001789
Publication number (International publication number):2000200098
Application date: Jan. 07, 1999
Publication date: Jul. 18, 2000
Summary:
【要約】【課題】 認識性能を向上させる。【解決手段】 画像と音声の特徴パラメータを、固定の正規化係数によって正規化して統合し、統合パラメータとした場合には、画像または音声の特徴パラメータそれぞれが、図17(A)または図17(B)に示すように、ある時刻において顕著な特徴を有する場合であっても、図17(C)に示すように、画像と音声の特徴パラメータどうしが相殺しあって、それぞれの顕著な特徴が失われることがある。そこで、図17(D)に示すように、画像と音声の時系列の特徴パラメータを、それぞれの特徴が失われない形で(最適な形で)統合して統合パラメータとすることができる時系列の正規化係数を用いて、統合パラメータが構成される。
Claim (excerpt):
複数の入力データについて、それぞれの特徴を表す時系列の特徴パラメータの正規化に用いる時系列の正規化係数を求めるための学習を行う学習装置であって、所定の学習用の正規化係数に基づいて、前記複数の入力データの特徴パラメータそれぞれを正規化する正規化手段と、正規化された複数の前記特徴パラメータそれぞれについて、所定の標準パラメータとの距離を算出する算出手段と、前記距離に基づき、時系列の前記特徴パラメータそれぞれについて、認識時に用いる時系列の前記正規化係数を決定する決定手段とを備えることを特徴とする学習装置。
IPC (5):
G10L 21/02
, G06F 15/18 560
, G10L 15/06
, G10L 15/24
, G10L 15/02
FI (5):
G10L 3/02 301 A
, G06F 15/18 560 G
, G10L 3/00 521 F
, G10L 3/00 571 Q
, G10L 5/06 A
F-Term (17):
5D015EE01
, 5D015FF05
, 5D015GG05
, 5D015LL07
, 9A001BB02
, 9A001BB03
, 9A001BB04
, 9A001EE05
, 9A001EZ02
, 9A001FF10
, 9A001GZ05
, 9A001HH07
, 9A001HH16
, 9A001HH17
, 9A001HH23
, 9A001KK37
, 9A001KK46
Patent cited by the Patent:
Cited by examiner (7)
-
音声検出方法
Gazette classification:公開公報
Application number:特願平6-228535
Applicant:沖電気工業株式会社
-
統合認識対話装置
Gazette classification:公開公報
Application number:特願平7-038581
Applicant:シャープ株式会社, 技術研究組合新情報処理開発機構
-
階層的感情認識装置
Gazette classification:公開公報
Application number:特願平9-030576
Applicant:株式会社エイ・ティ・アール知能映像通信研究所
Show all
Return to Previous Page