特許
J-GLOBAL ID:200903078730609404

音声信号の区分化及び認識のシステム及び方法

発明者:
出願人/特許権者:
代理人 (1件): 鈴江 武彦 (外4名)
公報種別:公表公報
出願番号(国際出願番号):特願2000-592818
公開番号(公開出願番号):特表2002-534718
出願日: 1999年12月29日
公開日(公表日): 2002年10月15日
要約:
【要約】【課題】 音声信号の区分化及び認識のシステム及び方法を提供すること。【解決手段】 複数のフレームを有する入力音声信号から区分化された音声信号を形成するシステム及び方法が開示されている。入力音声信号は時間ドメイン信号から複数の音声フレームを有する周波数ドメイン信号に変換され、その周波数ドメイン信号における各音声フレームが該音声フレームと関連された少なくとも1つのスペクトル値によって表現される。次いで、スペクトル差異が周波数ドメイン信号における隣接フレーム対の各々に対して決定され、隣接フレーム対の各々に対するそのスペクトル差異は隣接フレーム対における各フレームと関連された少なくとも1つのスペクトル値の間の差異を表している。初期クラスタ境界が周波数ドメイン信号における隣接フレームの各対の間に設定され、分散値が周波数ドメイン信号における各クラスタに対して割り当てられ、各クラスタに対するその分散値は前記決定されたスペクトル差異値の内の1つとそれぞれ同等である。次に、複数のクラスタ併合パラメータが計算され、そうしたクラスタ併合パラメータの各々は周波数ドメイン信号における隣接クラスタ対と関連されている。最小クラスタ併合パラメータが複数のクラスタ併合パラメータから選択される。次いで、最小併合パラメータと関連されたクラスタ間のクラスタ境界を相殺すると共に、併合分散値を併合クラスタに割り当てることによって併合クラスタは形成され、併合分散値は最小併合パラメータと関連されたクラスタに割り当てられた分散値を表している。このプロセスは、複数の併合クラスタを形成するために繰り返され、区分化された音声信号が複数の併合クラスタに従って形成される。
請求項(抜粋):
音声認識システムにおいて、複数のフレームを有する入力音声信号から区分化された音声信号を形成する方法であって、 前記入力音声信号を時間ドメイン信号から複数の音声フレームを有する周波数ドメイン信号に変換する段階であり、該周波数ドメイン信号における各音声フレームが該音声フレームと関連された少なくとも1つのスペクトル値で表現されることから成る段階と、 前記音声フレーム各々に対するクラスタを規定すべく、前記周波数ドメイン信号における隣接フレームの各対の間に初期クラスタ境界を割り当てる段階と、 各クラスタにおける前記フレームと関連された前記少なくとも1つのスペクトル値に基づいて前記クラスタ各々に分散値を割り当てる段階と、 前記分散値に基づき隣接クラスタ対の間のクラスタ境界を相殺することによって併合されたクラスタを形成する段階と、 複数の併合クラスタを形成するために、分散値の割り当て及び併合クラスタの形成の前記段階を繰り返す段階と、 前記複数の併合クラスタに従って前記区分化音声信号を形成する段階と、の諸段階を含む方法。
IPC (2件):
G10L 15/10 ,  G10L 15/04
FI (3件):
G10L 3/00 531 F ,  G10L 3/00 531 E ,  G10L 3/00 515 C
Fターム (3件):
5D015CC01 ,  5D015DD03 ,  5D015HH04

前のページに戻る