特許
J-GLOBAL ID:200903055551328095

日本語音声認識方法

発明者:
出願人/特許権者:
代理人 (1件): 草野 卓
公報種別:公開公報
出願番号(国際出願番号):特願平4-170898
公開番号(公開出願番号):特開平6-012091
出願日: 1992年06月29日
公開日(公表日): 1994年01月21日
要約:
【要約】【目的】 入力音声を仮名漢字混じり文字列に高い認識率で変換する。【構成】 日本語の文節構文6と読みを振った単語辞書7とを用いて各単語の最初の文字について入力音声と音素の標準パターンとの類似度を求め、かつその文字が最初に生起する尤度を求め、その類似度と尤度との和を総合尤度とし、総合尤度の高いものを残し、それについて2番目の文字について同様に類似度及び生起尤度の和の高いものを探し、また得られた単語について総合尤度の高いものについて、名詞+助詞の構造から、その名詞の次に来る助詞の候補のそれぞれについて入力音声との類似度とその生起尤度との総合尤度をそれぞれ求め、以下同様にして、求めた文節中の各全体として総合尤度の最も高いものを求め、その文節を認識結果とする。
請求項(抜粋):
入力音声を特徴パラメータの時系列とし、日本語の構文、単語辞書、文字音素変換規則、及びテキストデータベースより作成された生起順序に関する統計的言語モデルを用いて、上記入力音声の特徴パラメータ時系列について、複数の音声認識候補を選出し、これら各音声認識候補について、標準パターンと上記入力音声の特徴パラメータ時系列とをそれぞれ照合して、生起の尤度と類似の尤度との総合尤度の高い候補を認識結果とする日本語音声認識方法において、上記統計的言語モデルとして、漢字の読みを振ったテキストデータベースから作成された、読みを振った仮名、及び漢字の生起順序に関する統計的言語モデルを用い、上記日本語の構文として、日本語文節の構造を単語の遷移規則として記述した文法を用い、上記単語辞書として、読みを振った仮名、及び漢字系列の単語の集合を用い、上記文字音素変換規則として、読みを振った仮名、及び漢字を音素の記号列に変換する規則を用い、上記標準パターンとして、音素標準パターンを用いる、ことを特徴とする日本語音声認識方法。
IPC (2件):
G10L 3/00 531 ,  G10L 3/00 561

前のページに戻る