Pat
J-GLOBAL ID:200903096193137990

ミックスチャ分解識別による話者検証方法と装置

Inventor:
Applicant, Patent owner:
Agent (1): 岡部 正夫 (外10名)
Gazette classification:公開公報
Application number (International application number):1996123854
Publication number (International publication number):1996314491
Application date: May. 20, 1996
Publication date: Nov. 29, 1996
Summary:
【要約】【課題】 精度の高い音声認識を実現する。【解決手段】 ミックスチャ分解識別(MDD)と呼ばれる新型話者検証方法およびMDDを使うための新しい装置について示す。MDDは話者個別認識装置からミックスチャ・コンポーネント・スコア情報を取り出し、この情報が単一の話者個別認識装置のパラメータに組み込まれる前にHMMの状態応答を示すコンポーネント・スコアのミックスチャとして、まだ分解されている間にこの情報を伝送する。MDDは群正規化された話者依存型HMMに基づいた既存の検証方法の性能を改善させるのに非常に効果的である。MDDは話者依存型線形識別装置と一緒に使われる。これは、比較的演算容量と記憶容量が少ない。これにより、ハイブリッドMDD/CNHMMシステムの高い性能は、演算とデータ記憶アセットを最小限拡大するだけで達成することができる。
Claim (excerpt):
入力ワード・ストリングの話者検証装置であって、複数の話者検証データ・ファイルの1つへのアクセス・キーを得るために、前記入力ワード・ストリングを区分化して認識する第一のHMMによる話者個別音声認識装置と、線形識別器と、ミックスチャ・コンポーネント・スコア情報が単一定量に組み込まれる前に、前記ミックスチャ・コンポーネント・スコア情報を前記話者個別音声認識装置の内部処理から前記線形識別装置へ提供するための手段と、各話者検証データ・ファイルに真話者仮説または、偽話者仮説とを区別する特定の話者のモデルまたは、特定の話者のモデルを含有する複数の話者検証データ・ファイルを記憶する手段と、前記複数の話者検証データ・ファイルから前記アクセス・キーに該当する話者検証データ・ファイルにアクセスし、このアクセスされたデータ・ファイルを前記線形識別器に伝送する手段と、音声入力が特定の話者からのものなのか、または仮説またはモデル試験の結果によるスコアによるものではないのかを判断するための手段とを含む装置。
IPC (2):
G10L 3/00 531 ,  G10L 3/00 535
FI (2):
G10L 3/00 531 L ,  G10L 3/00 535
Patent cited by the Patent:
Cited by examiner (5)
  • 特公平3-070239
  • 話者認識方法
    Gazette classification:公開公報   Application number:特願平4-344586   Applicant:日本電信電話株式会社
  • 特開平3-054600
Show all

Return to Previous Page