特許
J-GLOBAL ID:200903086500926730

音声認識方法及びプログラム記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 草野 卓 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-268443
公開番号(公開出願番号):特開2002-073078
出願日: 2000年09月05日
公開日(公表日): 2002年03月12日
要約:
【要約】【課題】 仮説の履歴修正における計算量を減少する。【解決手段】 仮説絞込みにより棄却した仮説を、その棄却時刻と、最終単語又は音素履歴ごとにバッファメモリ26の異なる記憶領域43,44,45...に記憶し、履歴修正時に再評価する仮説の最終単語の開始時刻及びその直前の単語または最終単語までの音素履歴と同一の記憶領域の仮説のみをバッファメモリ26から読出して、履歴修正に利用する。
請求項(抜粋):
各時刻に新しい仮説を生成し、その仮説の単語内における入力音声の、仮説と対応する音響モデルとの近さを示す音響スコアを計算すると共に、仮説の単語終端において、単語間の接続関係を規定する言語モデルを用いてその仮説の存在する確率と対応した言語スコアを求め、これら音響スコアと言語スコアとから文法の許容する入力音声内容に関するその仮説の尤もらしさを示す仮説のスコアを求め、その仮説のスコアの低い仮説を棄却し、この棄却した仮説をバッファメモリに記録し、仮説の入力音声の開始時刻から現在の時刻までの単語系列を表す単語履歴を、上記バッファメモリに記録された過去の時刻に棄却された仮説に基づいて修正することで仮説を再評価し、全ての音声が入力された時点で最もスコアの高い仮説を認識結果として出力する音声認識方法において、上記棄却された仮説を、仮説が棄却された時刻を表す仮説棄却時刻と、単語履歴の最後の単語を表す最終単語、もしくは最終単語の終端までの所定個数の音素列を表す音素履歴ごとに分類して上記バッファメモリに記録し、前記再評価する仮説の最終単語の開始時刻と同一の仮説棄却時刻、ならびに、再評価する仮説の最終単語の一つ前の単語を表す先行単語もしくは最終単語までの音素履歴と同一の、最終単語もしくは音素履歴に分類されている上記バッファメモリ内の仮説のみを読み出して、再評価する仮説の履歴の修正に利用することを特徴とする音声認識方法。
IPC (3件):
G10L 15/18 ,  G10L 15/08 ,  G10L 15/28
FI (3件):
G10L 3/00 537 G ,  G10L 3/00 537 H ,  G10L 3/00 561 J
Fターム (3件):
5D015HH23 ,  5D015LL03 ,  5D015LL04
引用特許:
出願人引用 (1件)
  • 音声認識装置
    公報種別:公開公報   出願番号:特願平6-265175   出願人:三菱電機株式会社
審査官引用 (1件)
  • 音声認識装置
    公報種別:公開公報   出願番号:特願平6-265175   出願人:三菱電機株式会社

前のページに戻る