Pat
J-GLOBAL ID:200903089686642409
音声信号検索方法,音声検索のための音声信号蓄積方法,音声信号検索装置,そのプログラムおよびそのプログラムの記録媒体
Inventor:
,
,
Applicant, Patent owner:
Agent (1):
小笠原 吉義 (外2名)
Gazette classification:公開公報
Application number (International application number):2002047806
Publication number (International publication number):2003248494
Application date: Feb. 25, 2002
Publication date: Sep. 05, 2003
Summary:
【要約】【課題】 音声データの検索において,固定長データ間の単純なマッチングにより類似距離の計算時間を短くし,検索キーと類似する音声データを高速に検索できるようにする。【解決手段】 時間窓切り出し部12により検索対象となる音声信号から複数種類の長さの時間窓を使ってそれぞれ長さの異なる部分音声時系列特徴量を抽出し,部分音声時系列特徴量固定長化部13により部分音声時系列特徴量を線形伸縮して,所定の基準時間窓の長さにそろえ,これを音声蓄積部14により蓄積する。検索時には,検索キーの入力音声信号から検索キー音声時系列特徴量抽出部18により前記基準時間窓の長さの検索キー音声時系列特徴量ベクトルを抽出し,これと検索対象の音声時系列特徴量ベクトルとの類似距離計算を特徴量情報比較部16で行って,類似度の高いものを検索結果とする。
Claim (excerpt):
検索対象となる音声信号から複数種類の長さの時間窓を使ってそれぞれ長さの異なる部分音声時系列特徴量を抽出する過程と,抽出された複数種類の長さの部分音声時系列特徴量を線形伸縮して,検索時における類似距離計算の基準となる基準時間窓の長さにそろえる過程と,前記基準時間窓の長さにそろえた部分音声時系列特徴量を,検索キーとして入力される音声信号から得られる音声時系列特徴量ベクトルと比較するための検索対象となる音声時系列特徴量ベクトルとして蓄積する過程と,検索キーとして入力または指定された音声信号から前記基準時間窓の長さの検索キー音声時系列特徴量ベクトルを抽出する過程と,前記検索対象として蓄積された音声時系列特徴量ベクトルと前記検索キー音声時系列特徴量ベクトルとの類似距離を計算し,検索キーの音声信号と検索対象である各音声信号区間の音声信号との類似度を算出する過程と,類似度の算出結果に基づいて検索結果を出力する過程とを有することを特徴とする音声信号検索方法。
IPC (6):
G10L 11/00
, G06F 17/30 170
, G06F 17/30 350
, G10L 15/00
, G10L 15/02
, G10L 15/10
FI (5):
G06F 17/30 170 E
, G06F 17/30 350 C
, G10L 3/00 515 A
, G10L 3/00 551 G
, G10L 3/00 531 A
F-Term (7):
5B075ND14
, 5B075PP07
, 5B075PP12
, 5B075QM05
, 5D015DD03
, 5D015HH01
, 5D015HH04
Patent cited by the Patent:
Return to Previous Page