特許
J-GLOBAL ID:200903027675654833

初頭/末尾の音素類似度ベクトルによる中国語の音声認識方法及びその装置

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-351452
公開番号(公開出願番号):特開2001-166789
出願日: 1999年12月10日
公開日(公表日): 2001年06月22日
要約:
【要約】【課題】 認識精度をより高め、必要とされるメモリを小さくすることができる初頭/末尾の音素類似度ベクトルによる中国語の音声認識装置を提供する。【解決手段】 中国語の音声認識装置は、音声信号を受け、フィルター処理されたアナログ信号を作り出す音声信号フィルターと、音声信号からデジタル音声信号へ変換するデジタル-アナログ(A/D)変換器と、デジタル信号を受けて処理するためコンピュータと、音声信号のピッチ周波数の特性を探知し、それによって音声信号の声調を認識するピッチ周波数探知装置と、音声信号の音節の終点を探知し、それによって音節の始めと終わりを定める音声信号プレプロセッサと、初頭部分のPSVモデルと末尾部分のPSVモデルを訓練し、初頭部分PSVモデルと末尾部分のPSVモデルの訓練されたパラメータに基づく音節モデルを訓練する訓練部分と、を含む。
請求項(抜粋):
中国語の音声認識方法であって、訓練された初頭部分のモデルパラメータを有する初頭部分のモデルを作り出すために、音素類似度ベクトル(PSV)モデルを初頭部分に訓練するステップと、訓練された末尾部分のモデルパラメータを有する末尾部分のモデルを作り出すために、PSVを末尾部分に訓練するステップと、前記訓練された初頭部分パラメータ値及び前記訓練された末尾部分パラメータ値を音節モデルの開始パラメータとして使って音節モデルを作り出すために、PSVを訓練音声の音節に訓練するステップと、対象の音声サンプルを前記音節モデルで処理するステップと、前記対象の音声サンプルを、前記対象の音声サンプルが前記音節モデルとの一致度に基づく対象の音声音節として認識するステップと、前記対象の音声音節に従って、前記対象の音声サンプルを漢字として表示するステップと、を含む中国語の音声認識方法。
IPC (6件):
G10L 15/10 ,  G10L 13/00 ,  G10L 21/06 ,  G10L 15/04 ,  G10L 15/06 ,  G10L 15/12
FI (6件):
G10L 3/00 531 Z ,  G10L 3/00 S ,  G10L 3/00 515 C ,  G10L 3/00 521 C ,  G10L 3/00 521 F ,  G10L 3/00 533 Z
Fターム (7件):
5D015BB02 ,  5D015CC13 ,  5D015FF06 ,  5D015GG00 ,  5D015HH07 ,  5D015HH23 ,  5D045AB30

前のページに戻る