特許
J-GLOBAL ID:200903011531001009

音声認識モデル学習方法

発明者:
出願人/特許権者:
代理人 (1件): 磯村 雅俊
公報種別:公開公報
出願番号(国際出願番号):特願平5-033236
公開番号(公開出願番号):特開平6-250686
出願日: 1993年02月23日
公開日(公表日): 1994年09月09日
要約:
【要約】【目的】 音声認識システムの認識性能をより向上させることが可能な音声認識モデル学習方法を提供する。【構成】 音声認識システム1の認識モデル学習部6に、認識対象データである認識辞書中の単語を構成する音素の種類を単語別に調べる機能と、学習用テキストデータ4を解析することによって、予め学習に使用可能な全学習用音声データ2の音素毎の音素環境別の出現個数を、認識対象データ中の単語を構成する音素について調べる機能と、学習用テキストデータの解析によって得られた各音素の音素環境別の出現個数から、なるべく認識対象単語と一致する文脈の長い音素の音声データだけで学習を行なうように認識単語毎の音素モデルの学習用音声データを選び、音素モデルの学習を行なう機能とを持たせる。
請求項(抜粋):
認識の最小単位として音素の認識モデルを使用し、音素の認識モデルを連結して認識辞書中の単語の認識モデルを作成し、複数の音素が連続的に発声される連続音声の各音素に対応する音声区間を自動的に検出して、該音声区間のデータを音素の認識モデルの学習に使用する音声認識モデル学習方法において、予め認識辞書中の単語を構成する音素と、該音素に対応する、学習用音声データ中の音素の出現個数を音素環境の一致する長さ別に調べ、一致する長さと出現個数に基づいて、認識単語を構成する音素の認識モデルの学習に使用する、音声データの量を制限することを特徴とする音声認識モデル学習方法。

前のページに戻る