Pat
J-GLOBAL ID:200903059812631136

マルチテンプレートによる音声認識装置

Inventor:
Applicant, Patent owner:
Agent (1): 永田 武三郎
Gazette classification:公開公報
Application number (International application number):1993297346
Publication number (International publication number):1995129189
Application date: Nov. 02, 1993
Publication date: May. 19, 1995
Summary:
【要約】【目的】 単語音声認識装置において、同一カテゴリに対して複数の辞書を登録する従来のマルチテンプレート方式に比べて、認識性能を保持しつつ、全体の登録語数を最小限に抑制しユーザの発声の負担を軽減させ、限られた辞書メモリを有効に利用し得るマルチテンプレートによる音声認識装置の提供。【構成】 登録単語のリストを制御対象機器7に付属するディスプレイ等に表示してユーザに報知する。登録する単語が指定されるとユーザに対して登録のための音声の発声要求をディスプレイ等に表示する。発声された音声はマイク1により収音され分析部2により音声認識のための分析データとして出力され、認識部3に入力され音声区間が検出され、この音声データに対して認識部3でデータの圧縮及び直交展開を行い音声認識用辞書の作成を行う。辞書5の登録状況のチェックを行い標準辞書エリアに全て登録されているとき、格納された辞書データの相互の類似性の測定を複合類似度により行い、類似単語の判定を行う。類似単語と判定された単語番号を他の辞書領域に記録しマルチテンプレート化する。
Claim (excerpt):
音声入力部と、音声入力部から入力された音声を分析し、認識する音声認識部と、音声認識部によって認識された認識単語を登録する第1の辞書領域、及び第2の辞書領域を有する辞書部と、前記登録後、登録された認識単語相互間の類似度を求め該類似度が所定値を超える認識単語を類似単語として抽出する類似単語抽出手段と、前記類似単語を報知する報知手段と、を有し、前記類似単語として抽出された単語の再発声音を前記音声入力部に入力し、前記音声認識部により認識単語を得て第2の辞書領域に登録することを特徴とするマルチテンプレートによる音声認識装置。
IPC (2):
G10L 3/00 521 ,  G10L 3/00
Patent cited by the Patent:
Cited by examiner (3)
  • 特開昭63-136097
  • 特開昭63-038994
  • 特開昭59-124398

Return to Previous Page