特許
J-GLOBAL ID:201703019822186301

音声処理装置、音声処理方法、プログラムおよび集積回路

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人 ナカジマ知的財産綜合事務所
公報種別:特許公報
出願番号(国際出願番号):特願2013-548126
特許番号:特許第6039577号
出願日: 2013年03月11日
請求項(抜粋):
【請求項1】 入力されたオーディオ信号の単位区間の特徴を表現する区間特徴を単位区間ごとに計算する特徴計算手段と、 複数の単位区間それぞれに対して、当該単位区間を含む区間特徴の類似する複数の単位区間からなる類似区間と他の区間との境界に関する境界情報を計算する境界計算手段と、 前記境界情報で示される境界それぞれの優先度を計算し、前記優先度に基づいて、前記境界それぞれがシーン変化点であるか否かを判定する判定手段と を備え、 前記境界計算手段は、前記境界情報として、前記類似区間の始端の時刻または終端の時刻の少なくとも一方を計算し、 前記単位区間を第2単位区間とし、前記第2単位区間は、複数の連続する第1単位区間からなり、 さらに、複数種類のサウンド素片それぞれの特徴を表現する確率モデルをあらかじめ記憶しているモデル記憶手段と、 前記確率モデルを用いて、前記オーディオ信号の前記サウンド素片それぞれに対する尤度を成分とする尤度ベクトルを、前記第1単位区間ごとに生成する尤度ベクトル生成手段とを備え、 前記区間特徴は、前記第2単位区間に含まれる複数の第1単位区間の尤度ベクトルを用いて生成され、前記サウンド素片それぞれの出現頻度を示す頻度ベクトルである ことを特徴とする音声処理装置。
IPC (1件):
G10L 25/57 ( 201 3.01)
FI (1件):
G10L 25/57

前のページに戻る