特許
J-GLOBAL ID:200903095484428383

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 吉田 研二 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-019490
公開番号(公開出願番号):特開平8-211897
出願日: 1995年02月07日
公開日(公表日): 1996年08月20日
要約:
【要約】【目的】 時間に関して局所的に動的な特徴を捉え、子音の判別および過渡部分における判別精度を上昇する。【構成】 音響処理部12においては、LPCケプストラム、1次デルタケプストラム、2次デルタケプストラムの3つに基づいた第1〜第3パラメータを計算する。第1パラメータは、静的な特徴を捉え、第2パラメータは時間的に動的な特徴を捉え、第3パラメータは時間に関し局所的に動的な特徴を捉える。そして、単語辞書14にも標準パターンについての第1〜第3パラメータが記憶されている。そこで、DPマッチング部16において、これら3つのパラメータの入力音声と標準パターンの距離に基づく音声認識が行われる。
請求項(抜粋):
入力音声をパラメータ化し、参照すべき単語辞書と比較して音声認識を行う音声認識装置において、入力音声の時間に関して静的な特徴を捉えた第1パラメータと、入力音声の時間に関して動的な特徴を捉えた第2パラメータと、入力音声の時間的な動きについての変化を特徴としてとらえた第3パラメータと、を生成する入力音声のパラメータ化手段と、このパラメータ化手段において生成された各パラメータに関する重み係数を算出する重み係数算出手段と、前記第1、第2、第3パラメータおよびこれら各パラメータについての重み係数に基づいて、前記単語辞書を参照し、最適な単語を選択する単語認識手段と、を有することを特徴とする音声認識装置。
IPC (3件):
G10L 5/06 ,  G10L 3/00 535 ,  G10L 9/16 301

前のページに戻る