特許
J-GLOBAL ID:200903096193137990

ミックスチャ分解識別による話者検証方法と装置

発明者:
出願人/特許権者:
代理人 (1件): 岡部 正夫 (外10名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-123854
公開番号(公開出願番号):特開平8-314491
出願日: 1996年05月20日
公開日(公表日): 1996年11月29日
要約:
【要約】【課題】 精度の高い音声認識を実現する。【解決手段】 ミックスチャ分解識別(MDD)と呼ばれる新型話者検証方法およびMDDを使うための新しい装置について示す。MDDは話者個別認識装置からミックスチャ・コンポーネント・スコア情報を取り出し、この情報が単一の話者個別認識装置のパラメータに組み込まれる前にHMMの状態応答を示すコンポーネント・スコアのミックスチャとして、まだ分解されている間にこの情報を伝送する。MDDは群正規化された話者依存型HMMに基づいた既存の検証方法の性能を改善させるのに非常に効果的である。MDDは話者依存型線形識別装置と一緒に使われる。これは、比較的演算容量と記憶容量が少ない。これにより、ハイブリッドMDD/CNHMMシステムの高い性能は、演算とデータ記憶アセットを最小限拡大するだけで達成することができる。
請求項(抜粋):
入力ワード・ストリングの話者検証装置であって、複数の話者検証データ・ファイルの1つへのアクセス・キーを得るために、前記入力ワード・ストリングを区分化して認識する第一のHMMによる話者個別音声認識装置と、線形識別器と、ミックスチャ・コンポーネント・スコア情報が単一定量に組み込まれる前に、前記ミックスチャ・コンポーネント・スコア情報を前記話者個別音声認識装置の内部処理から前記線形識別装置へ提供するための手段と、各話者検証データ・ファイルに真話者仮説または、偽話者仮説とを区別する特定の話者のモデルまたは、特定の話者のモデルを含有する複数の話者検証データ・ファイルを記憶する手段と、前記複数の話者検証データ・ファイルから前記アクセス・キーに該当する話者検証データ・ファイルにアクセスし、このアクセスされたデータ・ファイルを前記線形識別器に伝送する手段と、音声入力が特定の話者からのものなのか、または仮説またはモデル試験の結果によるスコアによるものではないのかを判断するための手段とを含む装置。
IPC (2件):
G10L 3/00 531 ,  G10L 3/00 535
FI (2件):
G10L 3/00 531 L ,  G10L 3/00 535
引用特許:
審査官引用 (5件)
  • 特公平3-070239
  • 話者認識方法
    公報種別:公開公報   出願番号:特願平4-344586   出願人:日本電信電話株式会社
  • 特開平3-054600
全件表示

前のページに戻る