特許
J-GLOBAL ID:200903037409437865
音声処理装置およびプログラム
発明者:
,
,
出願人/特許権者:
,
代理人 (3件):
大林 章
, 矢代 仁
, 高橋 太朗
公報種別:公開公報
出願番号(国際出願番号):特願2007-184872
公開番号(公開出願番号):特開2009-020458
出願日: 2007年07月13日
公開日(公表日): 2009年01月29日
要約:
【課題】音声信号を区分した複数の区間を正確に発声者ごとに分類する。【解決手段】特徴抽出部41は、音声信号Sを時間軸上で区分したN個の区間Bの各々について特徴量を抽出する。指標算定部43は、N個の区間Bのなかから2個の区間Bを選択する総ての組合せについて、2個の区間Bにおける特徴量の類否を示す類否指標値を算定する。音声分類部45は、N個の区間Bの各々と当該区間Bに特徴量が最も類似する区間Bとが同じクラスタに属するように、各区間の類否指標値に基づいてN個の区間Bを複数の集合に分類する。【選択図】図1
請求項(抜粋):
音声信号を時間軸上で区分した複数の区間の各々について特徴量を抽出する特徴抽出手段と、
前記複数の区間のなかから2個の区間を選択する複数の組合せについて、前記2個の区間における前記特徴量の類否を示す類否指標値を算定する指標算定手段と、
前記複数の区間の各々と当該区間に特徴量が最も類似する区間とが同じ集合に属するように、前記各区間の類否指標値に基づいて前記複数の区間を複数の集合に分類する音声分類手段と
を具備する音声処理装置。
IPC (3件):
G10L 11/00
, G10L 17/00
, G10L 15/06
FI (3件):
G10L11/00 402L
, G10L17/00 200Z
, G10L15/06 400U
Fターム (1件):
引用特許: