特許
J-GLOBAL ID:200903047767695278
連続音声認識方式及び標準パタン訓練方式
発明者:
出願人/特許権者:
代理人 (1件):
高野 明近 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-032455
公開番号(公開出願番号):特開平9-016192
出願日: 1996年02月20日
公開日(公表日): 1997年01月17日
要約:
【要約】【課題】 タスクに応じて音声類の環境を考慮した文脈自由文法を生成し、機構が単純で、記憶量の小さい構文解析部を用いて音声認識の照合範囲を狭くするとともに、環境を考慮した標準パタンを適応的に訓練することによって、高速で高精度な照合が可能な連続音声認識方式を提供する。【解決手段】 スイッチ9をA側に入れ、LRチャート構文解析部5を駆動して、音素環境依存型の文法を作成する。得られた文から記号処理部12で認識タスクとして必要な文を選択し、終端記号の並びに応じて、環境依存型の終端記号列に変換し、環境依存動作表部4に記憶しておく。次に、スイッチ9をB側に入れ、LRチャート解析部5で、LR解析表からどの音素を照合すればよいかを決定し、照合部2において、DSTモデルと入力音声の特徴量との照合を行い、解析した文の句構造は、解析チャートに記憶しておき、最終的に最も小さい得点を持つ候補を認識結果として出力する。
請求項(抜粋):
入力音声の特徴量を抽出する手段と、類の一部を代表するパタンを時間方向に連結して状態遷移モデルとなし、音声の類をモデル化する手段と、音声記号列を文法により解析する構文解析手段と、状態遷移モデルにおける各状態の照合継続時間を制御しながら入力音声パタンを照合する手段とを備え、当該状態遷移モデルと入力手声の特徴パタンとを比較することによって、認識結果を得る連続音声認識方式において、LRチャート構文解析部で受理された音声記号列を用いて、類の前後環境を含めた終端記号列を生成し、文法を作成することにより、類の前後環境を含めた状態遷移モデルを未知入力音声と照合することを特徴とする連続音声認識方式。
IPC (4件):
G10L 3/00 561
, G10L 3/00 521
, G10L 3/00
, G10L 3/00 535
FI (4件):
G10L 3/00 561 G
, G10L 3/00 521 F
, G10L 3/00 521 Q
, G10L 3/00 535
引用特許:
審査官引用 (7件)
-
連続音声認識方式
公報種別:公開公報
出願番号:特願平6-161961
出願人:株式会社リコー
-
不特定話者連続音声認識方法
公報種別:公開公報
出願番号:特願平5-247835
出願人:株式会社エイ・ティ・アール音声翻訳通信研究所
-
ヒドン・マルコフ・モデルの学習方法
公報種別:公開公報
出願番号:特願平5-156431
出願人:沖電気工業株式会社
-
特開平4-181298
-
パターン認識装置
公報種別:公開公報
出願番号:特願平5-173138
出願人:シャープ株式会社
-
特開昭62-113196
-
特開昭63-026699
全件表示
前のページに戻る