特許
J-GLOBAL ID:200903014626524130

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 有我 軍一郎
公報種別:公開公報
出願番号(国際出願番号):特願2001-291825
公開番号(公開出願番号):特開2003-099083
出願日: 2001年09月25日
公開日(公表日): 2003年04月04日
要約:
【要約】【課題】 認識結果出力までの遅延時間を短縮し、計算コストを軽減することが可能な音声認識装置を提供すること。【解決手段】 事前音声データの各クラスタについて、音声クラスモデルを生成するための音声クラスモデル生成手段と、各音声クラスモデルに基づいて複数の適応音響モデル生成するための適応化処理手段と、音声クラスモデルに対する入力音声の尤度を計算するための音声クラスモデル尤度計算手段とを有する1以上のモデル生成手段からなるモデル群生成手段40と、音声クラスモデルに対する入力音声の尤度を基準に複数の適応音響モデルの中から最適な適応音響モデルを選択するための適応音響モデル選択手段60と、適応音響モデル選択手段が選択した適応音響モデルを用いて入力音声の音声認識を行うための音声認識手段50とを備え、音声クラスモデル尤度計算手段は、入力音声の先頭近傍のデータを用いて尤度を計算する構成を有する。
請求項(抜粋):
複数の音声クラスモデルを生成するための音声クラスモデル生成手段と、前記各音声クラスモデルに基づいて複数の適応音響モデル生成するための適応化処理手段と、前記音声クラスモデルに対する入力音声の尤度を計算するための音声クラスモデル尤度計算手段とを有する1以上のモデル生成手段からなるモデル群生成手段と、前記音声クラスモデルに対する入力音声の尤度を基準に前記複数の適応音響モデルの中から最適な適応音響モデルを選択するための適応音響モデル選択手段と、前記適応音響モデル選択手段が選択した適応音響モデルを用いて前記入力音声の音声認識を行うための音声認識手段とを備えたことを特徴とする音声認識装置。
IPC (2件):
G10L 15/06 ,  G10L 15/14
FI (4件):
G10L 3/00 521 S ,  G10L 3/00 521 N ,  G10L 3/00 535 C ,  G10L 3/00 521 V
Fターム (3件):
5D015GG01 ,  5D015GG04 ,  5D015GG06
引用特許:
審査官引用 (4件)
全件表示
引用文献:
前のページに戻る