Pat
J-GLOBAL ID:200903076326254101

ソース音声信号内の新規点の識別方法

Inventor:
Applicant, Patent owner:
Agent (1): 中島 淳 (外1名)
Gazette classification:公開公報
Application number (International application number):2001140826
Publication number (International publication number):2002014691
Application date: May. 11, 2001
Publication date: Jan. 18, 2002
Summary:
【要約】【課題】 音楽又は音声における変化点を自動検出する方法を提供する。【解決手段】 音声信号内の変化又は新規の点を決定する方法は、音声信号の成分の自己類似性を測定する。音声信号内の各時間ウィンドウごとに、パラメータ表示の値ベクトルを決定するために演算式が用いられる。各パラメータ表示の値間の相互類似性及び自己類似性が、過去及び未来ウィンドウの全ての領域で決定される。新規性の有効な点は、過去と未来とで高い自己類似性を有し、且つ低い相互類似性を有する。過去未来との間の時間差の範囲は、システムのスケールを変えるために変更され得る。結果は、任意の時点でのソース音声の新規性の程度の測定である。本方法は、話し言葉又は音楽のセグメント化、索引付け、ビート・トラッキング、及び要約を含む多種多様なアプリケーションで用いられ得る。
Claim (excerpt):
ソース音声信号内の新規点を識別するための方法であって、前記音声信号をサンプリングし、該音声信号をウィンドウ化された部分に分割するステップであって、複数のサンプルが該ウィンドウ化された部分のそれぞれの中から抽出される、音声信号をサンプリング及び分割するステップと、各ウィンドウのためのベクトル・パラメータを生成するために、第1の関数を各ウィンドウ化された部分に適用することにより、前記音声信号のウィンドウ化された部分をパラメータ化するステップと、前記パラメータ間の類似性の測定をもたらす第2の関数を適用することにより、前記パラメータを埋め込むステップと、を含む、ソース音声信号内の新規点の識別方法。
IPC (3):
G10L 15/04 ,  G10L 15/00 ,  G10L 15/10
FI (5):
G10L 3/00 515 C ,  G10L 3/00 531 N ,  G10L 3/00 531 C ,  G10L 9/16 301 B ,  G10L 3/00 551 G
F-Term (6):
5D015AA06 ,  5D015CC03 ,  5D015CC11 ,  5D015FF06 ,  5D015HH04 ,  5D015KK01
Patent cited by the Patent:
Cited by examiner (3)
  • 特許第2664136号
  • 特開昭62-212699
  • 特許第3757719号

Return to Previous Page