特許
J-GLOBAL ID:200903041244708327

音声モデル生成装置

発明者:
出願人/特許権者:
代理人 (1件): 曾我 道照 (外6名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-031522
公開番号(公開出願番号):特開平11-231888
出願日: 1998年02月13日
公開日(公表日): 1999年08月27日
要約:
【要約】【課題】 非母国語話者が発声した音声の認識に適した音声モデルを生成する音声モデル生成装置を得る。【解決手段】 入力音声の特徴ベクトル時系列に対する、母国語話者の音響モデルによる音声単位(疑似音素単位)の全接続をゆるす連続音声認識において、接続する音声単位数に制限を付けた照合を行って音声単位系列を求めることで、非母国語話者の発話様態を表す精度の良い音声モデルを生成する。
請求項(抜粋):
入力される音声信号に対し音響分析を施し特徴ベクトル時系列に変換する音響分析手段と、外国語の任意の音声単位を表す音響モデルを記憶・格納する音響モデルメモリと、上記音響分析手段が、発声内容既知の入力音声信号に対し音響分析を施して得られた特徴ベクトル時系列を入力とし、音声単位数制限データ入力端から入力される音声単位数制限データに従って、該音響モデルメモリ上の音響モデルとの音声単位数制限付き連続照合をおこなう音声単位数制限付き連続音声認識手段と、上記発声内容既知の入力音声信号の発声内容データに基づき、上記音声単位数制限付き連続音声認識手段の出力であるところの、音声単位系列と各音声単位の入力音声信号上の位置データを入力として、発声内容の全部もしくは任意の部分内容に対応する音声単位系列を求め出力する音声単位系列抽出手段と、上記音声単位系列抽出手段が出力した、発声内容の全部もしくは任意の部分内容に対応する音声単位系列と、上記音響モデルメモリ上の音響モデルとを用いて、該発声内容の全部もしくは任意の部分内容を表す音声モデルを生成する音声モデル生成手段と、を備えたことを特徴とする音声モデル生成装置。

前のページに戻る