Pat
J-GLOBAL ID:200903062058795195
インデキシング装置、方法及びプログラム
Inventor:
Applicant, Patent owner:
Agent (1):
酒井 宏明
Gazette classification:公開公報
Application number (International application number):2007007947
Publication number (International publication number):2008175955
Application date: Jan. 17, 2007
Publication date: Jul. 31, 2008
Summary:
【課題】インデキシングの精度を向上させることが可能なインデキシング装置、方法及びプログラムを提供する。【解決手段】音声信号を特徴づけるための音響モデルを生成する際、所定時間毎の音声特徴量から生成した音響モデル同士の類似度のうち、当該類似度が所定値以上となる領域の音声特徴量から音響モデルを生成し、この領域の音響モデルと前記音声特徴量とを用いて導出された第2区間毎の音声信号を特徴づける特徴ベクトルを話者毎に分類する。【選択図】 図2
Claim (excerpt):
複数の話者の音声が含まれた音声信号から、各話者の話者性を表す音声特徴量を所定の時間長毎に抽出する抽出手段と、
前記音声特徴量を所定時間長からなる第1区画毎に分割する第1分割手段と、
前記第1区間毎に、当該第1区間に含まれる音声特徴量に基づいて第1音響モデルを生成する第1音声モデル生成手段と、
連続する所定数分の前記第1区間を一の領域として順次設定し、当該領域毎の類似度を、各領域に含まれる前記第1区間の第1音響モデルに基づいて算出する類似度算出手段と、
前記類似度が所定値以上となる領域を学習領域として抽出する領域抽出手段と、
前記学習領域毎に、当該学習領域に含まれる音声特徴量に基づいて第2音響モデルを生成する第2音響モデル生成手段と、
前記音声特徴量を所定時間長からなる第2区画毎に分割する第2分割手段と、
前記学習領域毎の第2音響モデルと前記第2区画毎の音声特徴量とを用いて、各第2区間に固有の特徴ベクトルを夫々導出する特徴ベクトル導出手段と、
前記特徴ベクトルのベクトル成分に基づいて、各特徴ベクトルに対応する前記第2区間毎の音声特徴量を話者毎に分類するクラスタリング手段と、
前記クラスタリング手段による分類結果に基づいて、対応する前記音声信号部分に話者を分類するための情報を含んだ話者情報を付与するインデキシング手段と、
を備えたことを特徴とするインデキシング装置。
IPC (5):
G10L 17/00
, G10L 15/04
, G10L 15/00
, G10L 15/06
, G10L 11/00
FI (5):
G10L17/00 200C
, G10L15/04 200
, G10L15/00 200U
, G10L15/06 400U
, G10L11/00 402Z
F-Term (1):
Patent cited by the Patent:
Cited by applicant (1)
Cited by examiner (2)
Return to Previous Page