特許
J-GLOBAL ID:200903058697732814

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 小鍜治 明 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-218327
公開番号(公開出願番号):特開平7-072891
出願日: 1993年09月02日
公開日(公表日): 1995年03月17日
要約:
【要約】【目的】 本発明は、述語が省略されたり文末に述語が無い倒置表現の文音声を正しく認識できる音声認識装置を提供することを目的とする。【構成】 音声信号は音声分析部1に入力され、フレーム類似度算出部3、スポッティング部5を経て文節ラティスが作成される。キーワード推定部8では、文節ラティス中からまず類似度スコアの高い文節仮説(以降、キーワードと呼ぶ)を幾つか見つけ、構文情報格納部6の係り受け関係規則を参照することにより、キーワードを受ける述語を推定する。入力文推定部7では、推定された述語とキーワードおよび構文情報格納部6の係り受け関係規則を用いて文節ラティス中から文節列を探索し、認識結果とする。
請求項(抜粋):
入力音声を分析の単位であるフレーム毎に分析し、特徴パラメータを得る音声分析部と、「認識の基本単位」である音素または音節の特徴を表わす標準パターンを格納する標準パターン格納部と、上記特徴パラメータと標準パターンとの間の類似度をフレーム毎に算出するフレーム類似度算出部と、「言語単位」である単語または文節の発音に関する情報を上記認識の基本単位を表す発音記号によって表記した発音情報格納部と、上記発音情報格納部に格納されている全ての言語単位に対する、入力音声の任意の区間における類似度を算出してラティスを作成するスポッティング部と、認識対象となる文における上記言語単位の間の結合情報を格納する構文情報格納部と、上記スポッティング部で作成されたラティスから前記入力音声の表わす文を推定し認識結果とする入力文推定部と、上記入力推定部で入力文を推定する際に手がかりとするキーワードを上記スポッティング部で作成されたラティスから推定するキーワード推定部とを具備する音声認識装置。
IPC (2件):
G10L 3/00 531 ,  G10L 3/00 561
引用特許:
審査官引用 (9件)
  • 特開昭63-311398
  • 特開平4-119466
  • 連続音声認識装置
    公報種別:公開公報   出願番号:特願平3-266377   出願人:ソニー株式会社
全件表示

前のページに戻る