Pat
J-GLOBAL ID:200903007017384422

オンライン話者逐次区別システム及びそのコンピュータプログラム

Inventor:
Applicant, Patent owner:
Agent (1): 清水 敏
Gazette classification:公開公報
Application number (International application number):2007281441
Publication number (International publication number):2009109712
Application date: Oct. 30, 2007
Publication date: May. 21, 2009
Summary:
【課題】オンラインで動作可能でレイテンシの低い発話逐次区別システムを提供する。【解決手段】話者区別システム30は、話者GMM74-78を記憶する記憶部42と、音声データをセグメント化する音声活動検出部30と、現セグメントが話者GMM74-78のいずれにも属していないかを判定する新規性判定部34と、現セグメントが話者GMM74-78のいずれにも属していないときに、新たな話者GMMを生成し、現セグメントを新たな話者GMMでラベル付けする新モデル生成部40と、現セグメントが話者GMM74-78の1つに属しているときに、話者を識別し、現セグメントをその話者でラベル付けする話者識別部44と、現セグメントを利用して話者GMMをトレーニングするトレーニング部48と、音声活動検出部30が出力したセグメントのシーケンスに従ってセグメントラベルをマージするマージ部46とを含む。【選択図】 図1
Claim (excerpt):
オンラインの話者逐次区別(diarization)システムであって、 各々が一意の識別ラベルを有する話者依存音響モデルを記憶するための第1の記憶手段と、 入来する音声データの音声活動を検出し前記音声データを一連の発話セグメントにセグメント化するための音声活動検出手段と、 前記音声活動検出手段から出力された現在の発話セグメントが前記話者依存音響モデルのいずれにも属していないか否かを決定するための新規性検出手段と、 前記新規性検出手段による、前記現在の発話セグメントが前記話者依存音響モデルのいずれにも属していないとの決定に応答して、前記現在の発話セグメントに対応する新しい話者依存音響モデルを前記第1の記憶手段に生成するための新モデル生成手段とを含み、前記新しい話者依存音響モデルは一意の識別ラベルを有し、前記手段はさらに、前記現在の発話セグメントを前記新しい話者依存音響モデルのラベルでラベル付けするためのものであり、 前記システムはさらに、 前記新規性検出手段による、前記現在の発話セグメントが前記話者依存音響モデルの一つに属しているとの決定に応答して、前記話者依存音響モデルの前記一つを識別し、前記現在の発話セグメントを前記話者依存音響モデルの前記一つのラベルでラベル付けするための話者識別手段と、 前記新モデル生成手段が前記新しい話者依存音響モデルを生成したことに応答して、又は前記話者識別手段が前記話者依存音響モデルの一つを識別したことに応答して、前記新たな話者依存音響モデル又は前記識別された話者依存音響モデルを、前記現在の発話セグメントの音響データを利用してそれぞれトレーニングするためのトレーニング手段と、 前記新モデル生成手段と前記話者識別手段とによって出力される前記発話セグメントのラベルを、前記音声活動検出手段によって出力された前記発話セグメントのシーケンスに従ってマージするための手段と、を含む、オンライン話者逐次区別システム。
IPC (2):
G10L 17/00 ,  G10L 15/06
FI (3):
G10L17/00 200C ,  G10L15/06 500P ,  G10L15/06 310Z
F-Term (1):
5D015AA03

Return to Previous Page