特許
J-GLOBAL ID:200903011419011468
音声認識装置及び音声認識方法
発明者:
,
出願人/特許権者:
代理人 (1件):
渡部 敏彦
公報種別:公開公報
出願番号(国際出願番号):特願平8-336291
公開番号(公開出願番号):特開平10-161692
出願日: 1996年12月03日
公開日(公表日): 1998年06月19日
要約:
【要約】【課題】 音声モデルに対して高速な雑音適応を行なうことを可能とする音声認識装置を提供する。【解決手段】 雑音モデルと音声モデルを用いて雑音適応音声モデルをPMC法によって作成するに際し、従来のように全モデルの全分布に対してPMC変換を行うのではなく、雑音適応部204にて、音声モデルの分布をグループ化またはクラスタリングして複数の代表分布を作成し、その各代表分布とそのグループ内分布の位置関係を保存して、代表分布のみをPMC変換する。そして、PMC変換した代表分布と保存した位置関係とに基づいて、雑音適応音声モデルを作成する。
請求項(抜粋):
音声を取り込む音声入力手段と、前記音声入力手段によって取り込まれた入力音声を分析する音響分析手段と、前記音響分析手段の分析結果と認識対象の類似性を求めるモデルを作成するモデル作成手段と、前記分析結果と前記モデルの出力確率を求める出力確率算出手段と、認識対象の言語的制約を記述する制約記述手段とを有し、これらの手段を用いて言語探索を行い、入力音声に対する認識候補と尤度を求めて認識結果を決定し出力する音声認識装置において、前記モデル作成手段は、入力データより非音声区間を抽出し、抽出した区間のデータを用いて雑音モデルを作成する雑音モデル作成手段と、音声モデルの分布をグループ化またはクラスタリングして複数の代表分布を作成する代表分布作成手段と、前記各代表分布とそのグループ内分布の位置関係を保存する保存手段と、前記代表分布のみをPMC変換するPMC変換手段と、前記PMC変換手段によってPMC変換した代表分布と前記保存手段に保存されている位置関係とに基づいて、前記モデルとして雑音適応音声モデルを作成する雑音適応音声モデル作成手段とを備えたことを特徴とする音声認識装置。
IPC (2件):
G10L 3/00 521
, G10L 3/00 561
FI (2件):
G10L 3/00 521 L
, G10L 3/00 561 G
引用特許:
審査官引用 (3件)
-
音響モデルの適応化法
公報種別:公開公報
出願番号:特願平6-264097
出願人:日本電信電話株式会社
-
耐雑音音韻モデルの作成方式
公報種別:公開公報
出願番号:特願平5-005688
出願人:日本電信電話株式会社
-
特開平2-083596
前のページに戻る