特許
J-GLOBAL ID:200903079620549542

音声認識方式

発明者:
出願人/特許権者:
代理人 (1件): 鈴江 武彦
公報種別:公開公報
出願番号(国際出願番号):特願平4-054711
公開番号(公開出願番号):特開平5-257491
出願日: 1992年03月13日
公開日(公表日): 1993年10月08日
要約:
【要約】【目的】精度を落とさずに高速に音声認識を行なう方式を提供することである。【構成】入力音声を音声分析部1により分析し、分析された特徴パラメータを変換部3に与えて、シンボル認識辞書2を使用してシンボル系列を求める。このシンボル系列を、第1のHMMがセットされた第1のHMM認識部5に通し、そのモデルがシンボル系列を出力する確率を求める。この認識処理結果の確率の大きい方から複数の単語を上位候補抽出部6により抽出し、第1のHMMより状態数の多いHMMがセットされた第2のHMM認識部8にシンボル系列を通し、そのモデルがシンボル系列を出力する確率を求める。この認識処理結果の確率をもとに単語を特定する。
請求項(抜粋):
音声信号を入力して音声分析し、特徴パラメータを求める音声分析手段と、この音声分析手段によって求められた特徴パラメータをシンボル系列に変換する変換手段と、前記シンボル系列を、単語ごとに予め作成された第1の隠れマルコフモデルに通し、そのモデルが前記シンボル系列を出力する確率を求める第1の確率決定手段と、この第1の確率決定手段によって求められた確率をもとに、確率の大きい方から複数の単語を抽出する上位候補抽出手段と、この上位候補抽出手段によって抽出された複数の単語についての、前記第1の隠れマルコフモデルより状態数の多い、予め作成された第2の隠れマルコフモデルに前記シンボル系列を通し、そのモデルが前記シンボル系列を出力する確率を求める第2の確率決定手段とを具備し、前記第2の確率決定手段によって決定された確率をもとに単語を特定するようにしたことを特徴とする音声認識方式。
IPC (3件):
G10L 3/00 535 ,  G10L 3/00 521 ,  G10L 5/06

前のページに戻る