Pat
J-GLOBAL ID:200903026181136906

音声認識システムと方法およびそのプログラムを記録した記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 磯村 雅俊 (外1名)
Gazette classification:公開公報
Application number (International application number):1998005431
Publication number (International publication number):1999202895
Application date: Jan. 14, 1998
Publication date: Jul. 30, 1999
Summary:
【要約】【課題】 音節毎に区切るようなゆっくりとした発声に対応できないといった、認識対象による発声の制約がある。【解決手段】 結果判定部5から照合部4へのフィードバックパスを設け、照合部4において、結果判定部5からフィードバックされる判定結果に基づき暫定的な候補をある時間蓄えておき、単語あるいは文の途中から照合処理を継続する。これにより、例えば、単語音声認識において、単語単位の標準パターンは変更しなくとも、照合の内部データを一部保持することにより、従来全く認識不可能であった音節単位で区切って発声される単語音声、すなわち、ポーズで分割された音節単位発声の単語音声もある程度正しく認識でき、また、一息では言いづらい長い単語の音声認識が可能となる。
Claim (excerpt):
音声をA/D変換して取り込む音声入力手段と、該音声入力手段で取り込んだ音声を所定の間隔(フレーム)毎に音響分析して特徴ベクトルの時系列パターンを求める音声分析手段と、該音声分析手段で求めた上記特徴ベクトルの時系列パターンから、音声の始端および終端を検出して音声区間を判定する音声区間検出手段と、該音声区間検出手段で判定した音声区間の上記特徴ベクトルの時系列パターンに対して、予め作成された複数の標準パターンとのそれぞれの尤度を取得する照合手段と、該照合手段で取得した尤度に基づき、上記音声入力手段で取り込んだ音声に対応する上記標準パターンおよび該標準パターンに予め対応付けられた言語情報を判定する判定手段と、該判定手段で判定した言語情報を出力する出力手段とからなる音声認識システムであって、先頭から末尾を含む任意の位置までの部分(先頭部分)が上記判定手段で上記音声に対応すると判定された上記標準パターンを抽出して上記照合手段に渡すフィードバック手段を設け、上記照合手段は、上記音声区間のそれぞれで、上記先頭部分での尤度と共に、上記フィードバック手段から渡された標準パターンの上記先頭部分の後からの部分(途中部分)での尤度を求め、上記判定手段は、上記途中部分での尤度を優先して、上記音声に対応する標準パターンを判定し、上記途中部分での尤度を優先して判定された標準パターンを、上記フィードバック手段を介して上記照合手段に渡し、上記照合手段と上記判定手段および上記フィードバック手段による処理を複数の上記音声区間に渡って繰り返し、複数の上記音声区間に渡って上記音声に最適に対応する標準パターンを特定することを特徴とする音声認識システム。
IPC (3):
G10L 5/06 ,  G10L 3/00 561 ,  G10L 3/00
FI (3):
G10L 5/06 D ,  G10L 3/00 561 C ,  G10L 3/00 561 H
Patent cited by the Patent:
Cited by examiner (6)
  • 音声認識装置
    Gazette classification:公開公報   Application number:特願平7-045386   Applicant:株式会社エイ・ティ・アール音声翻訳通信研究所
  • 音声認識装置
    Gazette classification:公開公報   Application number:特願平7-183916   Applicant:株式会社リコー
  • 特開平4-115296
Show all

Return to Previous Page