特許
J-GLOBAL ID:200903093817481497

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 京本 直樹 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-199404
公開番号(公開出願番号):特開平7-056592
出願日: 1993年08月11日
公開日(公表日): 1995年03月03日
要約:
【要約】【目的】使用者の音声を登録する際、その音声の、過去の音声に対する相対的な信頼度(相対信頼度)を使用者自身が設定することにより、精度の高い標準パターンを作成し、認識性能を格段に向上できる音声認識装置の提供。【構成】 分析部101で入力音声を分析し入力音声データを入力パターン作成部102に入力し、ここで入力音声データと入力語彙の情報をもとに特徴パラメータを計算し入力パターンとして出力し、標準パターン選択部103は、標準パターン格納部104から入力語彙情報をもとに入力パターンに対応する標準パターンを選択し出力し、相対信頼度設定部105は、使用者からの相対信頼度情報から相対信頼度を出力し、パターン適応部106は相対信頼度を用いて入力パターンと標準パターンとを合成し新しい標準パターンとして出力し、この適応パターンを用いて、認識部107で音声の認識を行なう。
請求項(抜粋):
使用者の発声から作成される音声認識用の適応化された標準パターンを用いる音声認識装置において、前記使用者の発声した音声を入力としこの入力音声を分析して前記適応化された標準パターン作成に必要な入力音声データを出力する分析部と、前記入力音声データとこれに対応する前記使用者の発声の語彙情報とを入力とし特徴パラメータを計算し入力パターンとして出力する入力パターン作成部と、音声認識用の標準パターンを記憶する標準パターン格納部と、前記語彙情報をもとに前記標準パターン格納部から前記入力パターンに対応する標準パターンを選択する標準パターン選択部と、以前に入力した音声と現在の入力音声との信頼度の比として定義される相対信頼度に関する情報を前記使用者から受けとり相対信頼度を出力する相対信頼度設定部と、前記相対信頼度を入力とし前記入力パターンとこれに対応する選択された前記標準パターンとを合成しそれを適応化された標準パターンとして出力するパターン適応部と、前記適応化された標準パターンを用いて前記使用者の音声を入力として音声の認識を行なう認識部とを含むことを特徴とする音声認識装置。
IPC (4件):
G10L 3/00 521 ,  G10L 3/00 ,  G10L 3/00 533 ,  G10L 3/00 535
引用特許:
審査官引用 (1件)
  • 特開昭62-031900

前のページに戻る