Pat
J-GLOBAL ID:200903073590066799

音声中の複数話者の発話区間自動検出同定装置

Inventor:
Applicant, Patent owner:
Agent (1): 深見 久郎 (外2名)
Gazette classification:公開公報
Application number (International application number):1992231157
Publication number (International publication number):1994083384
Application date: Aug. 31, 1992
Publication date: Mar. 25, 1994
Summary:
【要約】【目的】 この発明は任意数の未知話者の音声区間を検出して同定できるような音声中の複数話者の発話区間自動検出同定装置を提供することを主要な特徴とする。【構成】 入力音声1を音声特徴抽出部2で特徴ベクトルの時系列3に変換し、量子化部6によって共通符号帳作成部4で作成された共通符号帳5により符号の系列7に変換し、音声区間始終端検出部8で各音声区間ごとに各符号の出現頻度を算出し、出現確率算出部10で出現確率の集合11を作成し、クラスタ分析部12で幾つかのクラスタ13に分割し、そのクラスタ13の情報を基にして音声区間のクラス判別を行なう。
Claim (excerpt):
入力された音声から特徴パターンを抽出する音声特徴抽出手段、共通符号を作成する共通符号帳作成手段、前記音声特徴抽出手段によって抽出された特徴パターンを前記共通符号帳作成手段によって作成された共通符号で量子化する量子化手段、複数の音声区間に対して、前記共通符号の出現確率を算出する出現確率算出手段、前記出現確率算出手段によって算出された出現確率をクラスタ分析するクラスタ分析手段、および前記クラスタ分析手段で分析されたそれぞれのクラスタに属する出現確率を検出し、その出現確率に対応する音声区間を同定する同定手段を備えた、音声中の複数話者の発話区間自動検出同定装置。
IPC (2):
G10L 3/00 535 ,  G10L 3/00 513

Return to Previous Page