オーディオデータセグメントのクラスタリング方法

Inventor： ,
Applicant, Patent owner：
Agent (1)：中島淳 (外1名)
Gazette classification：公開公報
Application number (International application number)：1995082897
Publication number (International publication number)：1995287592
Application date： Apr. 07, 1995
Publication date： Oct. 31, 1995
Summary：

【要約】【目的】オーディオデータストリーム内にインデックスを作成する。【構成】オーディオストリームはオーディオデータソース12から与えられ、該データは、会話を行うスピーカー、オーディオトラックを伴う記録ビデオ、または他のオーディオソースによって与えられることが可能である。オーディオデータはオーディオプロセッサ14へ送られ、オーディオプロセッサは汎用コンピュータのような任意の公知デバイスであることが可能であり、本発明に従って構成されることが可能である。オーディオプロセッサはオーディオデータインデックス16を出力する。

Claim (excerpt)：

複数のスピーカーからの音声を有するオーディオデータ記録におけるオーディオデータセグメントの流動的クラスタリングの方法であって、a)前記オーディオデータ内の少なくとも全てのスピーカーからの音声を有する前記オーディオデータの部分を与えるステップと、b)前記オーディオ部分をデータクラスタへ分割するステップと、c)各クラスタペアのクラスタ間距離を算出するステップと、d)最小クラスタ間距離を有する2つのクラスタを結合して新たなクラスタとするステップと、e)所望のクラスタ数が得られるまで前記ステップb)、c)、およびd)を繰り返すステップと、を含む、オーディオデータセグメントのクラスタリング方法。

IPC (4)：

G10L 3/00 521 , G10L 3/00 531 , G10L 3/00 535 , H04R 3/00 310

Patent cited by the Patent：

Cited by applicant (2)

音声中の複数話者の発話区間自動検出同定装置
Gazette classification：公開公報 Application number：特願平4-231157 Applicant：株式会社エイ・ティ・アール自動翻訳電話研究所
自動音声認識用の音響プロトタイプを生成する方法及び装置
Gazette classification：公開公報 Application number：特願平4-155237 Applicant：インターナショナル・ビジネス・マシーンズ・コーポレイション

Cited by examiner (2)

音声中の複数話者の発話区間自動検出同定装置
Gazette classification：公開公報 Application number：特願平4-231157 Applicant：株式会社エイ・ティ・アール自動翻訳電話研究所
自動音声認識用の音響プロトタイプを生成する方法及び装置
Gazette classification：公開公報 Application number：特願平4-155237 Applicant：インターナショナル・ビジネス・マシーンズ・コーポレイション

Return to Previous Page