Pat
J-GLOBAL ID:200903026326297130
メガ話者識別(ID)システム及びその目的に相当する方法
Inventor:
,
Applicant, Patent owner:
Agent (3):
伊東 忠彦
, 大貫 進介
, 伊東 忠重
Gazette classification:公表公報
Application number (International application number):2004515125
Publication number (International publication number):2005530214
Application date: Jun. 04, 2003
Publication date: Oct. 06, 2005
Summary:
メガ話者識別(ID)システムに関連したプロセッサに、一般オーディオ・データ(GAD)を受信し、セグメントを生成する、オーディオのセグメンテーションと分類のファンクション(F10)、該セグメントを受信し、メル周波数ケプストラム係数(MFCC)に基づいた特徴をそこから抽出する、特徴抽出ファンクション(F12)、該抽出特徴を受信し、セグメントを、必要な場合、該抽出特徴に基づいて、再分類する、学習とクラスタ化のファンクション(14)、該GAD中の音声信号に話者IDを割り当てる、照合とラベル化のファンクション(16)、及び該割り当て話者IDを該GAD中のそれぞれの音声信号に関係付けるデータベース・ファンクションを有する、ファンクション、をインスタンス化させるコンピュータ判読可能な命令を記憶するメモリ。該オーディオのセグメンテーションと分類のファンクションは各セグメントを、無音、単一話者音声、音楽、環境雑音、複数話者の音声、同時の音声と音楽、及び音声と雑音を有する、N個のオーディオ信号クラス、の1つに割り当て得る。
Claim (excerpt):
一般オーディオ・データ(GAD)からの話者に帰属するオーディオ信号を識別するメガ話者識別(ID)システムであって:
該GADをセグメントにセグメント化する手段;
該セグメント各々をN個のオーディオ信号クラスの1つとして分類する手段;
該セグメントから特徴を抽出する手段;
該N個のオーディオ信号クラスの1つのものから別のものに該セグメントを、必要な場合、該抽出特徴に応じて、再分類する手段;
該セグメントの近くのものをクラスタ化し、該クラスタ化によってクラスタ化セグメントを生成する手段;及び
各クラスタ化セグメントを話者IDによってラベル化する手段;
を有することを特徴とするメガ話者識別(ID)システム。
IPC (5):
G10L17/00
, G10L11/00
, G10L11/02
, G10L15/00
, G10L15/10
FI (8):
G10L3/00 545A
, G10L11/00 101H
, G10L11/00 402G
, G10L11/00 402L
, G10L3/00 531N
, G10L5/06 B
, G10L11/02
, G10L3/00 551G
F-Term (5):
5D015AA03
, 5D015AA06
, 5D015CC11
, 5D015KK00
, 5D015LL11
Return to Previous Page