Pat
J-GLOBAL ID:200903002045198438

音声区間判別装置、音声認識装置、プログラム及び記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 足立 勉
Gazette classification:公開公報
Application number (International application number):2001034049
Publication number (International publication number):2002236494
Application date: Feb. 09, 2001
Publication date: Aug. 23, 2002
Summary:
【要約】【課題】 複数話者が並行して発声することで各話者の音声区間に重複が生じた場合であっても、各話者の音声区間を適切に判別する。【解決手段】 パターン記憶部14に、特定の男性話者の音声を識別するための男性モデル14a、特定の女性話者の音声を識別するための女性モデル14b、男性話者と女性話者との混合音声を識別するための混合モデル14c、無音区間を識別するための無音モデル14dの4つの統計モデル14a〜14dを記憶しておく。マッチング部13は、統計モデル14a〜14dとして予め作成された標準パターンと音響分析部12から送られきた音響特徴量との類似度計算し、この類似度に基づき、フレーム判定部15が、統計モデル14a〜14dの中からフレーム毎に最も確からしいモデルを選択する。この選択結果に基づいて、男性話者、女性話者のそれぞれの音声区間が、音声区間判別部17によって判別される。
Claim (excerpt):
外部から入力された音声を所定周期で音響的に分析し、当該分析結果を基に音響特徴量を求める音響分析手段と、前記入力音声に複数の話者の音声が混在し得る前提の下、単一話者の音声及び、複数話者の混合音声に対応する標準パターンを記憶する標準パターン記憶手段と、前記標準パターン記憶手段に記憶された標準パターンと、前記音響分析手段にて求められた音響特徴量とのマッチングを行うマッチング手段と、前記マッチング手段による処理結果に基づき、前記入力音声がいずれの標準パターンに類似しているかを前記所定周期毎に判定する判定手段と、前記判定手段による判定結果に基づき、前記各話者の音声区間を判別する音声区間判別手段とを備えていることを特徴とする音声区間判別装置。
IPC (5):
G10L 11/02 ,  G10L 15/04 ,  G10L 15/06 ,  G10L 15/10 ,  G10L 15/14
FI (5):
G10L 3/00 513 C ,  G10L 3/00 513 D ,  G10L 3/00 521 V ,  G10L 3/00 531 E ,  G10L 3/00 535 Z
F-Term (4):
5D015DD03 ,  5D015GG00 ,  5D015HH04 ,  5D015HH23
Patent cited by the Patent:
Cited by examiner (6)
Show all
Article cited by the Patent:
Cited by examiner (1)
  • 「話し言葉音声の認識を目指して」

Return to Previous Page