特許
J-GLOBAL ID:200903089686642409
音声信号検索方法,音声検索のための音声信号蓄積方法,音声信号検索装置,そのプログラムおよびそのプログラムの記録媒体
発明者:
,
,
出願人/特許権者:
代理人 (1件):
小笠原 吉義 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願2002-047806
公開番号(公開出願番号):特開2003-248494
出願日: 2002年02月25日
公開日(公表日): 2003年09月05日
要約:
【要約】【課題】 音声データの検索において,固定長データ間の単純なマッチングにより類似距離の計算時間を短くし,検索キーと類似する音声データを高速に検索できるようにする。【解決手段】 時間窓切り出し部12により検索対象となる音声信号から複数種類の長さの時間窓を使ってそれぞれ長さの異なる部分音声時系列特徴量を抽出し,部分音声時系列特徴量固定長化部13により部分音声時系列特徴量を線形伸縮して,所定の基準時間窓の長さにそろえ,これを音声蓄積部14により蓄積する。検索時には,検索キーの入力音声信号から検索キー音声時系列特徴量抽出部18により前記基準時間窓の長さの検索キー音声時系列特徴量ベクトルを抽出し,これと検索対象の音声時系列特徴量ベクトルとの類似距離計算を特徴量情報比較部16で行って,類似度の高いものを検索結果とする。
請求項(抜粋):
検索対象となる音声信号から複数種類の長さの時間窓を使ってそれぞれ長さの異なる部分音声時系列特徴量を抽出する過程と,抽出された複数種類の長さの部分音声時系列特徴量を線形伸縮して,検索時における類似距離計算の基準となる基準時間窓の長さにそろえる過程と,前記基準時間窓の長さにそろえた部分音声時系列特徴量を,検索キーとして入力される音声信号から得られる音声時系列特徴量ベクトルと比較するための検索対象となる音声時系列特徴量ベクトルとして蓄積する過程と,検索キーとして入力または指定された音声信号から前記基準時間窓の長さの検索キー音声時系列特徴量ベクトルを抽出する過程と,前記検索対象として蓄積された音声時系列特徴量ベクトルと前記検索キー音声時系列特徴量ベクトルとの類似距離を計算し,検索キーの音声信号と検索対象である各音声信号区間の音声信号との類似度を算出する過程と,類似度の算出結果に基づいて検索結果を出力する過程とを有することを特徴とする音声信号検索方法。
IPC (6件):
G10L 11/00
, G06F 17/30 170
, G06F 17/30 350
, G10L 15/00
, G10L 15/02
, G10L 15/10
FI (5件):
G06F 17/30 170 E
, G06F 17/30 350 C
, G10L 3/00 515 A
, G10L 3/00 551 G
, G10L 3/00 531 A
Fターム (7件):
5B075ND14
, 5B075PP07
, 5B075PP12
, 5B075QM05
, 5D015DD03
, 5D015HH01
, 5D015HH04
引用特許:
前のページに戻る