特許
J-GLOBAL ID:200903089846871140
音声データ処理装置
発明者:
,
,
,
出願人/特許権者:
代理人 (1件):
澤田 俊夫
公報種別:公開公報
出願番号(国際出願番号):特願平11-062546
公開番号(公開出願番号):特開2000-259167
出願日: 1999年03月10日
公開日(公表日): 2000年09月22日
要約:
【要約】【課題】 複数の音声区間からなる音声データをその内容に基づいて話題毎に正確且つ確実に時分割する。【解決手段】 音声区間を代表する特徴量を多次元空間上のベクトルで表現して、特徴量ベクトルの変化を測定することにより、各音声区間の関連性を定量化する。特徴量ベクトルの変化は、隣接する音声区間の特徴量ベクトルの内積を時系列で順次計算して、内積の値がある既定値以下となったとき、その隣接区間の関連性は低く、話題の区切りの分割すべき点として判定することができる。特徴ベクトルの次元が大きくなり過ぎると、特徴ベクトル間の一律の距離によって特徴量の関連度を評価することが困難になってくるので、予め決定されている写像関係を用いて、特徴ベクトルの次元数を下げ、次元を下げた特徴ベクトルの変化で関連性を評価してもよい。
請求項(抜粋):
無音区間で区切られた時間的に連続する複数の音声区間からなる音声データを分割するための音声データ処理装置であって、各音声区間を代表する特徴量を求める第1の手段と、特徴量に基づいて音声データを時分割する第2の手段と、を具備することを特徴とする音声データ処理装置。
IPC (3件):
G10L 15/04
, G10L 15/02
, G06F 17/27
FI (3件):
G10L 3/00 515 C
, G10L 3/00 515 B
, G06F 15/20 550 F
Fターム (4件):
5B009QA11
, 5B009SA03
, 5D015FF05
, 5D015FF06
前のページに戻る