特許
J-GLOBAL ID:200903002045198438

音声区間判別装置、音声認識装置、プログラム及び記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 足立 勉
公報種別:公開公報
出願番号(国際出願番号):特願2001-034049
公開番号(公開出願番号):特開2002-236494
出願日: 2001年02月09日
公開日(公表日): 2002年08月23日
要約:
【要約】【課題】 複数話者が並行して発声することで各話者の音声区間に重複が生じた場合であっても、各話者の音声区間を適切に判別する。【解決手段】 パターン記憶部14に、特定の男性話者の音声を識別するための男性モデル14a、特定の女性話者の音声を識別するための女性モデル14b、男性話者と女性話者との混合音声を識別するための混合モデル14c、無音区間を識別するための無音モデル14dの4つの統計モデル14a〜14dを記憶しておく。マッチング部13は、統計モデル14a〜14dとして予め作成された標準パターンと音響分析部12から送られきた音響特徴量との類似度計算し、この類似度に基づき、フレーム判定部15が、統計モデル14a〜14dの中からフレーム毎に最も確からしいモデルを選択する。この選択結果に基づいて、男性話者、女性話者のそれぞれの音声区間が、音声区間判別部17によって判別される。
請求項(抜粋):
外部から入力された音声を所定周期で音響的に分析し、当該分析結果を基に音響特徴量を求める音響分析手段と、前記入力音声に複数の話者の音声が混在し得る前提の下、単一話者の音声及び、複数話者の混合音声に対応する標準パターンを記憶する標準パターン記憶手段と、前記標準パターン記憶手段に記憶された標準パターンと、前記音響分析手段にて求められた音響特徴量とのマッチングを行うマッチング手段と、前記マッチング手段による処理結果に基づき、前記入力音声がいずれの標準パターンに類似しているかを前記所定周期毎に判定する判定手段と、前記判定手段による判定結果に基づき、前記各話者の音声区間を判別する音声区間判別手段とを備えていることを特徴とする音声区間判別装置。
IPC (5件):
G10L 11/02 ,  G10L 15/04 ,  G10L 15/06 ,  G10L 15/10 ,  G10L 15/14
FI (5件):
G10L 3/00 513 C ,  G10L 3/00 513 D ,  G10L 3/00 521 V ,  G10L 3/00 531 E ,  G10L 3/00 535 Z
Fターム (4件):
5D015DD03 ,  5D015GG00 ,  5D015HH04 ,  5D015HH23
引用特許:
審査官引用 (6件)
全件表示
引用文献:
審査官引用 (2件)
  • 「話し言葉音声の認識を目指して」
  • 「話し言葉音声の認識を目指して」

前のページに戻る