特許
J-GLOBAL ID:200903074939768806

自動音声認識方法及び装置

発明者:
出願人/特許権者:
代理人 (1件): 坂口 博 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-337998
公開番号(公開出願番号):特開2000-172292
出願日: 1999年11月29日
公開日(公表日): 2000年06月23日
要約:
【要約】【課題】 音声認識システムに改善されたロバストネスを提供するフィーチャ・ベクトルを構築するための、スペクトル・フィーチャを抽出する方法及びシステムを提供すること。【解決手段】 音響音声信号を処理するシステム及び方法が、ウェブレット変換(或いはフーリエ変換)を基本ツールとして使用する。本方法は本質的に、デジタル化音声信号にウェブレット変換(またはフーリエ変換)を実行することにより獲得されるスペクトル成分データを、"シンクロスキージング"するステップを含む。1態様では、シンクロスキーズド平面のスペクトル成分が、K平均クラスタ化アルゴリズムにより、動的に追跡される。こうして、各成分の振幅、周波数及び帯域幅が抽出される。この情報から生成されるケプストラムは、"K平均ワストラム"と呼ばれる。
請求項(抜粋):
自動音声認識のために、音響音声信号からスペクトル・フィーチャを抽出する方法を実行する、マシンにより実行可能な命令プログラムを有するプログラム記憶装置であって、前記方法が、複数の音声フレームの少なくとも1つに対して、音響音声信号をデジタル化するステップと、デジタル化音響音声信号の前記フレームに対して第1の変換を実行し、前記フレームのスペクトル・パラメータを抽出するステップと、音響エネルギが瞬時周波数値に集中されるように、類似の瞬時周波数を有するスペクトル成分をグループ化することにより、前記フレームの前記スペクトル・パラメータにスキージング変換を実行するステップと、前記スキーズド・スペクトル・パラメータをクラスタ化し、前記クラスタ化の結果得られるクラスタ中心により位置が決定される、前記フレームに対応する要素を決定するステップと、周波数、帯域幅及び重み値を、前記音声フレームの前記要素にマップするステップと、前記要素をその対応するフレームにマップするステップと、前記フレームの前記要素からスペクトル・フィーチャを生成するステップとを含む、プログラム記憶装置。
IPC (3件):
G10L 15/10 ,  G10L101:027 ,  G10L101:16
引用特許:
審査官引用 (2件)

前のページに戻る