Pat
J-GLOBAL ID:201503082041744935

音声処理装置、方法、及びプログラム

Inventor:
Applicant, Patent owner:
Agent (6): 藤原 康高 ,  手塚 史展 ,  小林 幹雄 ,  山下 正成 ,  泉 剛司 ,  小川 百合香
Gazette classification:公開公報
Application number (International application number):2013192399
Publication number (International publication number):2015060006
Application date: Sep. 17, 2013
Publication date: Mar. 30, 2015
Summary:
【課題】精度を低下させることなく話者クラスタリングを行なうことができる音声処理装置、方法、及びプログラムを提供する。【解決手段】取得部11は、音声を取得する。分割部12は、前記音声を所定の規則に従って複数の区間に分割する。算出部13は、区間の組み合わせ毎に、音声の類似度を算出する。推定部14は、区間毎に、音声の到来方向を推定する。修正部15は、到来方向が互いに近い区間を同一のグループに分類し、同一のグループに属する区間の組み合わせについて、類似度を修正する。クラスタリング部16は、修正後の類似度を用いて、区間をクラスタリングする。【選択図】図2
Claim (excerpt):
音声を取得する取得部と、 前記音声を所定の規則に従って複数の区間に分割する分割部と、 前記区間の組み合わせ毎に、前記音声の類似度を算出する算出部と、 前記区間毎に、前記音声の到来方向を推定する推定部と、 前記到来方向が互いに近い前記区間を同一のグループに分類し、同一の前記グループに属する前記区間の組み合わせについて、前記類似度を修正する修正部と、 修正後の前記類似度を用いて、前記区間をクラスタリングするクラスタリング部と を備える、音声処理装置。
IPC (3):
G10L 17/14 ,  G10L 17/00 ,  G10L 25/51
FI (4):
G10L17/14 ,  G10L17/00 200B ,  G10L17/00 400 ,  G10L25/51 400

Return to Previous Page