特許
J-GLOBAL ID:200903018302960366

高い雑音、歪み環境下でサウンド・楽音信号を認識するシステムおよび方法

発明者:
出願人/特許権者:
代理人 (4件): 大塚 康徳 ,  高柳 司郎 ,  大塚 康弘 ,  木村 秀二
公報種別:公表公報
出願番号(国際出願番号):特願2002-516764
公開番号(公開出願番号):特表2004-505328
出願日: 2001年07月26日
公開日(公表日): 2004年02月19日
要約:
オーディオ・サンプルを認識する方法は、大量のオリジナル記録のセットをインデックスしたデータベースからそのオーディオ・サンプルに最も忠実にマッチするオーディオ・ファイルを特定する。インデックスされた各オーディオ・ファイルは、ランドマーク時点とそれに対応するフィンガープリントとのセットによるデータベース・インデックスで表現される。ランドマークは、ファイルにおける再現可能な位置で生じ、ランドマーク時点もしくはその付近での信号の特徴量を表す。認識を実行するため、未知サンプルに対してランドマークおよびフィンガープリントが計算され、データベースからマッチング・フィンガープリントを取得するのに用いられる。マッチング・フィンガープリントを含む各ファイルについて、そのランドマークが、同じフィンガープリントが計算されたところのサンプルのランドマークと比較される。対応するランドマークの多くがリニアな対応関係にあるとき、すなわち、サンプルおよび取得されたファイルの同等のフィンガープリントが同様の時間進行をとる場合には、そのファイルがそのサンプルと同一であると認識される。この方法はあらゆるタイプのサウンドや楽曲に適用可能であり、とりわけ、背景雑音、圧縮による変形、伝送欠落といった線形もしくは非線形の歪みを受けたオーディオ信号に効果的である。サンプルは、データベースのエントリ数の対数に比例した時間で識別可能であり、十分な演算パワーがあれば、サウンドがサンプルされてからほぼリアルタイムで認識が行われる。
請求項(抜粋):
メディア・サンプルとメディア・ファイルを比較する方法であって、 前記メディア・サンプルにおける特定の位置を特徴づけるサンプル・フィンガープリントのセットを測定する測定ステップと、 前記メディア・ファイルにおける少なくとも1のファイル位置を特徴づけるファイル・フィンガープリントのセットを取得する取得ステップと、 前記メディア・サンプルの前記特定の位置と前記メディア・ファイルの前記ファイル位置との間で、対応する位置が同等のフィンガープリントを有する対応関係を生成する生成ステップと、 前記対応する位置がほぼリニアな対応関係にあるときに、前記メディア・サンプルと前記メディア・ファイルとを同一と認識する認識ステップと を有することを特徴とする方法。
IPC (3件):
G10L15/10 ,  G10L11/00 ,  G10L15/00
FI (3件):
G10L3/00 531N ,  G10L9/00 E ,  G10L3/00 551G
Fターム (3件):
5D015AA06 ,  5D015CC07 ,  5D015CC11
引用特許:
審査官引用 (5件)
全件表示

前のページに戻る