Pat
J-GLOBAL ID:200903072505113108
オーディオデータセグメントのクラスタリング方法
Inventor:
,
Applicant, Patent owner:
Agent (1):
中島 淳 (外1名)
Gazette classification:公開公報
Application number (International application number):1995082897
Publication number (International publication number):1995287592
Application date: Apr. 07, 1995
Publication date: Oct. 31, 1995
Summary:
【要約】【目的】 オーディオデータストリーム内にインデックスを作成する。【構成】 オーディオストリームはオーディオデータソース12から与えられ、該データは、会話を行うスピーカー、オーディオトラックを伴う記録ビデオ、または他のオーディオソースによって与えられることが可能である。オーディオデータはオーディオプロセッサ14へ送られ、オーディオプロセッサは汎用コンピュータのような任意の公知デバイスであることが可能であり、本発明に従って構成されることが可能である。オーディオプロセッサはオーディオデータインデックス16を出力する。
Claim (excerpt):
複数のスピーカーからの音声を有するオーディオデータ記録におけるオーディオデータセグメントの流動的クラスタリングの方法であって、a)前記オーディオデータ内の少なくとも全てのスピーカーからの音声を有する前記オーディオデータの部分を与えるステップと、b)前記オーディオ部分をデータクラスタへ分割するステップと、c)各クラスタペアのクラスタ間距離を算出するステップと、d)最小クラスタ間距離を有する2つのクラスタを結合して新たなクラスタとするステップと、e)所望のクラスタ数が得られるまで前記ステップb)、c)、およびd)を繰り返すステップと、を含む、オーディオデータセグメントのクラスタリング方法。
IPC (4):
G10L 3/00 521
, G10L 3/00 531
, G10L 3/00 535
, H04R 3/00 310
Patent cited by the Patent:
Cited by applicant (2)
-
音声中の複数話者の発話区間自動検出同定装置
Gazette classification:公開公報
Application number:特願平4-231157
Applicant:株式会社エイ・ティ・アール自動翻訳電話研究所
-
自動音声認識用の音響プロトタイプを生成する方法及び装置
Gazette classification:公開公報
Application number:特願平4-155237
Applicant:インターナショナル・ビジネス・マシーンズ・コーポレイション
Cited by examiner (2)
-
音声中の複数話者の発話区間自動検出同定装置
Gazette classification:公開公報
Application number:特願平4-231157
Applicant:株式会社エイ・ティ・アール自動翻訳電話研究所
-
自動音声認識用の音響プロトタイプを生成する方法及び装置
Gazette classification:公開公報
Application number:特願平4-155237
Applicant:インターナショナル・ビジネス・マシーンズ・コーポレイション
Return to Previous Page