Pat
J-GLOBAL ID:201503063057275620

声紋特徴モデルを更新するための方法及び端末

Inventor:
Applicant, Patent owner:
Agent (3): 伊東 忠重 ,  伊東 忠彦 ,  大貫 進介
Gazette classification:公表公報
Application number (International application number):2015509296
Publication number (International publication number):2015516091
Application date: Jul. 08, 2013
Publication date: Jun. 04, 2015
Summary:
本発明は、音声認識技術の分野に適用可能であり、声紋特徴モデルを更新するための方法及び端末を提供する。本方法は、少なくとも1人の話者を含むオリジナル・オーディオ・ストリームを取得するステップと、プリセット話者セグメンテーション及びクラスタリング・アルゴリズムによりオリジナル・オーディオ・ストリームにおける少なくとも1人の話者に係る各話者それぞれのオーディオ・ストリームを取得するステップと、少なくとも1人の話者に係る各話者それぞれのオーディオ・ストリームとオリジナル声紋特徴モデルとを別々にマッチングして、うまくマッチングしたオーディオ・ストリームを取得するステップと、オリジナル声紋特徴モデルを生成するためにうまくマッチングしたオーディオ・ストリームを追加のオーディオ・ストリーム訓練サンプルとして使用するステップと、オリジナル声紋特徴モデルを更新するステップとを含む。本発明において、通話中の有効なオーディオ・ストリームは、適応的に抽出され、追加のオーディオ・ストリーム訓練サンプルとして使用され、それによって、オリジナル声紋特徴モデルを動的補正し、それによって、比較的高い実用性を前提にして声紋特徴モデルの精度及び認識精度を改善する目的を達成する。
Claim (excerpt):
声紋特徴モデルを更新するための方法であって、 少なくとも1人の話者を含むオリジナル・オーディオ・ストリームを取得するステップと、 プリセット話者セグメンテーション及びクラスタリング・アルゴリズムに従って、前記オリジナル・オーディオ・ストリームにおける前記少なくとも1人の話者に係る各話者それぞれのオーディオ・ストリームを取得するステップと、 前記少なくとも1人の話者に係る各話者それぞれのオーディオ・ストリームとオリジナル声紋特徴モデルとを別々にマッチングして、うまくマッチングしたオーディオ・ストリームを取得するステップと、 前記オリジナル声紋特徴モデルを生成するために、前記うまくマッチングしたオーディオ・ストリームを追加のオーディオ・ストリーム訓練サンプルとして使用して、前記オリジナル声紋特徴モデルを更新するステップと、 を含む、方法。
IPC (3):
G10L 17/04 ,  G10L 17/00 ,  G10L 17/14
FI (3):
G10L17/04 ,  G10L17/00 200C ,  G10L17/14
Patent cited by the Patent:
Cited by applicant (4)
Show all
Cited by examiner (3)
Article cited by the Patent:
Return to Previous Page