Pat
J-GLOBAL ID:200903011419011468
音声認識装置及び音声認識方法
Inventor:
,
Applicant, Patent owner:
Agent (1):
渡部 敏彦
Gazette classification:公開公報
Application number (International application number):1996336291
Publication number (International publication number):1998161692
Application date: Dec. 03, 1996
Publication date: Jun. 19, 1998
Summary:
【要約】【課題】 音声モデルに対して高速な雑音適応を行なうことを可能とする音声認識装置を提供する。【解決手段】 雑音モデルと音声モデルを用いて雑音適応音声モデルをPMC法によって作成するに際し、従来のように全モデルの全分布に対してPMC変換を行うのではなく、雑音適応部204にて、音声モデルの分布をグループ化またはクラスタリングして複数の代表分布を作成し、その各代表分布とそのグループ内分布の位置関係を保存して、代表分布のみをPMC変換する。そして、PMC変換した代表分布と保存した位置関係とに基づいて、雑音適応音声モデルを作成する。
Claim (excerpt):
音声を取り込む音声入力手段と、前記音声入力手段によって取り込まれた入力音声を分析する音響分析手段と、前記音響分析手段の分析結果と認識対象の類似性を求めるモデルを作成するモデル作成手段と、前記分析結果と前記モデルの出力確率を求める出力確率算出手段と、認識対象の言語的制約を記述する制約記述手段とを有し、これらの手段を用いて言語探索を行い、入力音声に対する認識候補と尤度を求めて認識結果を決定し出力する音声認識装置において、前記モデル作成手段は、入力データより非音声区間を抽出し、抽出した区間のデータを用いて雑音モデルを作成する雑音モデル作成手段と、音声モデルの分布をグループ化またはクラスタリングして複数の代表分布を作成する代表分布作成手段と、前記各代表分布とそのグループ内分布の位置関係を保存する保存手段と、前記代表分布のみをPMC変換するPMC変換手段と、前記PMC変換手段によってPMC変換した代表分布と前記保存手段に保存されている位置関係とに基づいて、前記モデルとして雑音適応音声モデルを作成する雑音適応音声モデル作成手段とを備えたことを特徴とする音声認識装置。
IPC (2):
G10L 3/00 521
, G10L 3/00 561
FI (2):
G10L 3/00 521 L
, G10L 3/00 561 G
Patent cited by the Patent:
Cited by examiner (3)
-
音響モデルの適応化法
Gazette classification:公開公報
Application number:特願平6-264097
Applicant:日本電信電話株式会社
-
耐雑音音韻モデルの作成方式
Gazette classification:公開公報
Application number:特願平5-005688
Applicant:日本電信電話株式会社
-
特開平2-083596
Return to Previous Page