特許
J-GLOBAL ID:200903013424782173

音声認識装置及び方法並びに記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 加藤 朝道
公報種別:公開公報
出願番号(国際出願番号):特願2000-204111
公開番号(公開出願番号):特開2002-023788
出願日: 2000年07月05日
公開日(公表日): 2002年01月25日
要約:
【要約】【課題】標準パターン作成用あるいは話者学習用の発声から、一通りでなく複数種類の特徴抽出間隔・開始位置の特徴ベクトル時系列を抽出して、等価的に学習用のデータ量を増やし、発声の変動に対して頑健な標準パターンの作成あるいは話者適応化を可能にする装置及び方法の提供。【解決手段】1個の発声から複数の特徴抽出間隔、開始位置の特徴ベクトル時系列を複数抽出し、標準パターン作成あるいは話者学習に用いることで、等価的に多くの発声を収集したのと近い効果を得る。
請求項(抜粋):
音声認識に使用する標準パターンを作成する標準パターン作成装置において、複数の発声を記憶する音声波形記憶部と、発声からの特徴抽出位置を定めるパラメータを複数記憶する特徴抽出パラメータ記憶部と、前記音声波形記憶部に記憶されている発声を分析して特徴ベクトル時系列に変換するにあたり、前記特徴抽出パラメータ記憶部に記憶されている複数のパラメータに従って、一つの発声から複数の特徴ベクトル時系列を抽出する特徴抽出部と、前記特徴抽出部で抽出された前記複数の特徴ベクトル時系列を記憶する特徴ベクトル記憶部と、前記特徴ベクトル記憶部に記憶されている前記複数の特徴ベクトル時系列を用いて標準パターンを作成する学習部と、を備えている、ことを特徴とする標準パターン作成装置。
IPC (3件):
G10L 15/06 ,  G10L 11/00 ,  G10L 15/02
FI (3件):
G10L 3/00 521 C ,  G10L 3/00 515 A ,  G10L 3/00 521 S
Fターム (2件):
5D015FF00 ,  5D015GG05

前のページに戻る