特許
J-GLOBAL ID:200903023310351690

音声認識装置及び同装置に使用される学習方法ならびに学習装置及び同方法がプログラムされ記録された記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 志賀 正武
公報種別:公開公報
出願番号(国際出願番号):特願平11-047262
公開番号(公開出願番号):特開2000-250577
出願日: 1999年02月24日
公開日(公表日): 2000年09月14日
要約:
【要約】【課題】 骨導マイクロホンが持つ周波数特性の改善をはかり音声認識に用いる。合わせて騒音環境下での認識性能の向上をはかる。【解決手段】 第一の受音器101で収録された音声入力パターン(骨導音)を第一のコードブック110を用いて特徴ベクトルを選択して出力し、そのインデックスに対応する第二のコードブック121に記憶されている補正ベクトルを選択し、前記両ベクトルを加算し接続することにより前記第一の受音器より広い周波数帯域で受音感度が確保される第二の受音器112で収録された音声(気導音)の特徴ベクトルを推定する。また、推定された音声を音声認識対象として用い、参照用パターンとして音声辞書213に格納された音声パラメータを順次与え両パターンの照合を行う。
請求項(抜粋):
音声信号を第一の受音器により受音し、受音した音声信号から、予め定めた時間長のフレーム毎に特徴ベクトルを抽出する手段と、抽出された特徴ベクトルを一時的に記憶する手段と、第一の受音器で予め受音した音声信号から抽出した代表的な有限個の特徴ベクトルを第一のセットとして記憶する手段と、前記第一の受音器で予め受音した音声信号の特徴ベクトルと前記第一の受音器よりも広い周波数帯域で受音感度が確保される第二の受音器で予め受音した音声信号の特徴ベクトルとの差分を用いて算出した代表的な有限個の補正ベクトルを第二のセットとして記憶する手段と、前記第一のセットに属する特徴ベクトルと前記第二のセットに属する各々の補正ベクトルを対応付ける手段と、前記第一のセットに属する各々の特徴ベクトルに対して、前記第一の受音器で受音した音声信号から抽出された特徴ベクトルの類似度を算出する手段と、類似度の最も高い特徴ベクトルを前記第一のセットの中から選択し、このベクトルに対応する前記第二のセットに属する補正ベクトルを抽出する手段と、前記第一の受音器で受音した音声信号から抽出された特徴ベクトルに対して前記抽出された補正ベクトルを加算して生成される特徴ベクトルをフレーム毎に算出する手段と、この特徴ベクトルの系列に対し、予め辞書として記憶された特徴ベクトル系列との間で類似度を照合する手段と、照合された中から最も類似度の高い辞書の情報を出力する手段とを備えることを特徴とする音声認識装置。
IPC (3件):
G10L 15/06 ,  G10L 15/28 ,  G10L 15/02
FI (4件):
G10L 3/00 521 T ,  G10L 3/00 511 ,  G10L 3/00 515 B ,  G10L 3/00 521 U
Fターム (5件):
5D015DD01 ,  5D015FF04 ,  5D015FF05 ,  5D015GG00 ,  5D015HH04

前のページに戻る