特許
J-GLOBAL ID:200903073590066799
音声中の複数話者の発話区間自動検出同定装置
発明者:
出願人/特許権者:
代理人 (1件):
深見 久郎 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平4-231157
公開番号(公開出願番号):特開平6-083384
出願日: 1992年08月31日
公開日(公表日): 1994年03月25日
要約:
【要約】【目的】 この発明は任意数の未知話者の音声区間を検出して同定できるような音声中の複数話者の発話区間自動検出同定装置を提供することを主要な特徴とする。【構成】 入力音声1を音声特徴抽出部2で特徴ベクトルの時系列3に変換し、量子化部6によって共通符号帳作成部4で作成された共通符号帳5により符号の系列7に変換し、音声区間始終端検出部8で各音声区間ごとに各符号の出現頻度を算出し、出現確率算出部10で出現確率の集合11を作成し、クラスタ分析部12で幾つかのクラスタ13に分割し、そのクラスタ13の情報を基にして音声区間のクラス判別を行なう。
請求項(抜粋):
入力された音声から特徴パターンを抽出する音声特徴抽出手段、共通符号を作成する共通符号帳作成手段、前記音声特徴抽出手段によって抽出された特徴パターンを前記共通符号帳作成手段によって作成された共通符号で量子化する量子化手段、複数の音声区間に対して、前記共通符号の出現確率を算出する出現確率算出手段、前記出現確率算出手段によって算出された出現確率をクラスタ分析するクラスタ分析手段、および前記クラスタ分析手段で分析されたそれぞれのクラスタに属する出現確率を検出し、その出現確率に対応する音声区間を同定する同定手段を備えた、音声中の複数話者の発話区間自動検出同定装置。
IPC (2件):
G10L 3/00 535
, G10L 3/00 513
前のページに戻る