特許
J-GLOBAL ID:200903092642138240

話者認識方法及び装置

発明者:
出願人/特許権者:
代理人 (1件): 光石 俊郎 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-251243
公開番号(公開出願番号):特開平10-097274
出願日: 1996年09月24日
公開日(公表日): 1998年04月14日
要約:
【要約】【課題】 音韻の違いに影響されずに、話者認識を精度良く行うこと。【解決手段】 線形予測分析の結果から、調音器官の伝達特性の逆特性を持つ逆フィルタ12を設定し、この逆フィルタ12で入力音声波形をフィルタリングして音源波形を生成し、得られた音源波形を周波数分析部14に通してスペクトル強度パタンを得る。この音源波形のスペクトル強度パタンをフィルタバンク15でn個の周波数帯域F1〜Fnに分割し、調波構造分析部16にて、周波数帯域毎にスペクトル強度の凹凸を表す評価値V1〜Vnを算出する。各周波数帯域Fiでの評価値Viを、話者認識での特徴パタンに用いる。
請求項(抜粋):
音声波形から音源波形のスペクトル強度パタンを得ること、得られた音源波形のスペクトル強度パタンを複数の周波数帯域に区分すること、各周波数帯域毎に音源波形のスペクトル強度パタンの凹凸の程度を表す評価値を求めること、及び、求まった複数の周波数帯域における評価値と、予め学習により得たデータとから話者を認識することを特徴とする話者認識方法。
IPC (5件):
G10L 3/00 531 ,  G10L 3/02 301 ,  G10L 7/08 ,  G10L 9/14 301 ,  G10L 9/16 301
FI (5件):
G10L 3/00 531 L ,  G10L 3/02 301 A ,  G10L 7/08 A ,  G10L 9/14 301 A ,  G10L 9/16 301 A

前のページに戻る