特許
J-GLOBAL ID:200903069996581182

音声モデル作成装置,音声認識装置,音声モデル作成方法及び音声認識方法

発明者:
出願人/特許権者:
代理人 (1件): 田澤 博昭 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-275041
公開番号(公開出願番号):特開2001-100780
出願日: 1999年09月28日
公開日(公表日): 2001年04月13日
要約:
【要約】【課題】 英語を母国語としない話者が発声した英語連続音声の単語モデルを生成する際、単語カテゴリに含まれる単語音声データのみを用いて単語モデルを選択するようにしているため、その英語連続音声に類似度の高い単語カテゴリが存在する場合、その音声認識の誤り率が高くなる課題があった。【解決手段】 当該単語カテゴリに含まれない特徴ベクトル時系列に対する尤度をペナルティ要因に含めて、単語モデル群に対するクラスタリングを実施し、そのクラスタリングのセントロイドに選択されたとき平均尤度が最高になる単語モデルを出力する。
請求項(抜粋):
非ネイティブ話者の音声信号を音響分析して、特徴ベクトル時系列を出力する音響分析手段と、上記音響分析手段より出力された特徴ベクトル時系列から各単語区間に対応する特徴ベクトル時系列を切り出す単語データ切出手段と、ネイティブ話者の音響モデルを参照して、上記単語データ切出手段により切り出された特徴ベクトル時系列を音素ラベル系列に変換し、その音素ラベル系列から単語モデルを生成するモデル生成手段と、上記モデル生成手段により生成された単語モデルにネイティブ話者の単語モデルが加えられた単語モデル群に対するクラスタリングを実施して、そのクラスタリングのセントロイドに選択されたとき平均尤度が最高になる単語モデルを出力するクラスタリング手段と、上記クラスタリング手段が出力する単語モデルを用いて、上記単語データ切出手段により切り出された特徴ベクトル時系列に対するクラスタリングを実施して、各特徴ベクトル時系列に対し尤度を最大にする単語モデルを求めることで単語クラスデータを決定した後、クラスタリングの対象となる単語カテゴリに属さない特徴ベクトル時系列に対する尤度をペナルティ要因に含めて、上記単語モデル群に対するクラスタリングを実施し、そのクラスタリングのセントロイドに選択されたとき平均尤度が最高になる単語モデルを出力する再クラスタリング手段とを備えた音声モデル作成装置。
IPC (2件):
G10L 15/06 ,  G10L 15/00
FI (2件):
G10L 3/00 521 E ,  G10L 3/00 551 E
Fターム (5件):
5D015BB02 ,  5D015GG04 ,  5D015GG06 ,  5D015KK02 ,  5D015LL13
引用特許:
審査官引用 (8件)
全件表示
引用文献:
前のページに戻る