特許
J-GLOBAL ID:201503082041744935
音声処理装置、方法、及びプログラム
発明者:
,
,
出願人/特許権者:
代理人 (6件):
藤原 康高
, 手塚 史展
, 小林 幹雄
, 山下 正成
, 泉 剛司
, 小川 百合香
公報種別:公開公報
出願番号(国際出願番号):特願2013-192399
公開番号(公開出願番号):特開2015-060006
出願日: 2013年09月17日
公開日(公表日): 2015年03月30日
要約:
【課題】精度を低下させることなく話者クラスタリングを行なうことができる音声処理装置、方法、及びプログラムを提供する。【解決手段】取得部11は、音声を取得する。分割部12は、前記音声を所定の規則に従って複数の区間に分割する。算出部13は、区間の組み合わせ毎に、音声の類似度を算出する。推定部14は、区間毎に、音声の到来方向を推定する。修正部15は、到来方向が互いに近い区間を同一のグループに分類し、同一のグループに属する区間の組み合わせについて、類似度を修正する。クラスタリング部16は、修正後の類似度を用いて、区間をクラスタリングする。【選択図】図2
請求項(抜粋):
音声を取得する取得部と、
前記音声を所定の規則に従って複数の区間に分割する分割部と、
前記区間の組み合わせ毎に、前記音声の類似度を算出する算出部と、
前記区間毎に、前記音声の到来方向を推定する推定部と、
前記到来方向が互いに近い前記区間を同一のグループに分類し、同一の前記グループに属する前記区間の組み合わせについて、前記類似度を修正する修正部と、
修正後の前記類似度を用いて、前記区間をクラスタリングするクラスタリング部と
を備える、音声処理装置。
IPC (3件):
G10L 17/14
, G10L 17/00
, G10L 25/51
FI (4件):
G10L17/14
, G10L17/00 200B
, G10L17/00 400
, G10L25/51 400
前のページに戻る