特許
J-GLOBAL ID:200903068883366270

音声認識方法および音声認識装置ならびに音声認識処理プログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 鈴木 喜三郎 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-259085
公開番号(公開出願番号):特開2000-089783
出願日: 1998年09月08日
公開日(公表日): 2000年03月31日
要約:
【要約】【課題】 メモリ容量やCPUの処理能力に大きな制約のあるなかで、高い認識性能を得るようにする。【解決手段】 認識可能な複数の単語のうち、幾つかの単語を登録単語として選び、それぞれの登録単語を認識対象話者が発話し、その音声データから各登録単語ごとの登録単語データ101を作成してRAM10に保存し、前記認識対象話者から当該登録単語が発話された場合には、当該登録単語データ101を用いて音声認識し、それ以外の認識可能な単語が発話された場合には、特定話者群音声モデルデータ92を用いて音声認識する。さらに、前記登録単語データと前記特定話者群音声モデルデータとを用いて話者学習処理を行い、前記登録単語以外の認識可能単語を認識する際は、話者学習後のデータを用い話者適応して音声認識する。
請求項(抜粋):
不特定複数話者の音声データから作成された標準話者音声モデルデータを有し、予め定められた複数の単語を認識可能とする音声認識方法において、前記認識可能な複数の単語のうち、幾つかの単語を登録単語として選び、それぞれの登録単語を認識対象話者が発話し、その音声データから各登録単語ごとの登録単語データを作成して保存し、前記認識対象話者から当該登録単語が発話された場合には、当該登録単語データを用いて音声認識し、それ以外の認識可能な単語が発話された場合には、前記標準話者音声モデルデータを用いて音声認識することを特徴とする音声認識方法。
IPC (4件):
G10L 15/06 ,  G10L 15/02 ,  G10L 15/10 ,  G10L 15/28
FI (7件):
G10L 3/00 521 V ,  G10L 3/00 515 B ,  G10L 3/00 521 J ,  G10L 3/00 521 N ,  G10L 3/00 521 S ,  G10L 3/00 531 K ,  G10L 3/00 571 D
引用特許:
審査官引用 (11件)
  • 音声認識装置
    公報種別:公開公報   出願番号:特願平4-049363   出願人:日本電装株式会社
  • 特開昭56-140398
  • 特開昭57-063599
全件表示

前のページに戻る