特許
J-GLOBAL ID:200903064499009260

音声信号処理装置および音声信号処理方法

発明者:
出願人/特許権者:
代理人 (1件): 川▲崎▼ 研二
公報種別:公開公報
出願番号(国際出願番号):特願平11-300272
公開番号(公開出願番号):特開2001-117580
出願日: 1999年10月21日
公開日(公表日): 2001年04月27日
要約:
【要約】【課題】 入力される歌声や楽器音などの音声が譜面のどの位置にいるかをより正確に検出することが可能とする。【解決手段】 まず、音声信号が入力されると、その音声信号を所定の時間(フレーム)単位で区切り、フレーム単位の音声信号から特徴パラメータを取得する。そして、取得した特徴パラメータを符号帳を参照することにより、シンボル量子化し、音符辞書を参照してシンボル観測確率を取得する。そして、予め記憶された音符列にしたがって隠れマルコフモデルが形成し、ビタービアルゴリズムを用いて入力音声のフレームに対応する音符を特定する。これにより、入力音声が音符列のどの位置にいるかを特定できる。
請求項(抜粋):
入力音声を音符列のいずれかの音符と対応付ける音声信号処理装置であって、時間列で記述された音符列情報を記憶する音符列記憶手段と、フレーム単位で入力される音声信号から特徴パラメータを取得するパラメータ取得手段と、音声信号の代表的な特徴パラメータを特徴ベクトルとしてシンボルにクラスタ化した符号帳と、各音符毎に状態数、状態遷移確率および前記シンボルの観測確率とを記憶した認識用音符情報記憶手段と、前記認識用音符情報記憶手段を参照することにより、前記パラメータ取得手段により取得された特徴パラメータから前記入力音声の観測シンボルを取得し、該観測シンボルの観測確率を取得する観測確率取得手段と、前記認識用音符情報記憶手段に記憶された状態数および状態遷移確率に基づいて、前記音符列情報記憶手段に記憶された前記音符列の各状態を有限状態ネットワーク上で隠れマルコフモデルによって形成する状態形成手段と、前記観測確率取得手段によって取得された観測確率と、前記状態形成手段により形成された前記隠れマルコフモデルとにしたがって状態遷移を決定する状態遷移決定手段と、前記状態遷移決定手段によって決定された状態遷移に基づいて、前記入力音声信号の各フレームと前記音符列情報とを対応付ける対応付け手段とを具備することを特徴とする音声信号処理装置。
IPC (6件):
G10L 15/10 ,  G10G 3/04 ,  G10H 1/00 ,  G10H 1/00 102 ,  G10L 15/14 ,  G10L 15/00
FI (6件):
G10G 3/04 ,  G10H 1/00 B ,  G10H 1/00 102 Z ,  G10L 3/00 531 N ,  G10L 3/00 535 B ,  G10L 3/00 551 G
Fターム (16件):
5D015AA06 ,  5D015CC03 ,  5D015CC06 ,  5D015CC13 ,  5D015CC14 ,  5D015CC18 ,  5D015HH23 ,  5D015KK02 ,  5D082BB01 ,  5D082BB14 ,  5D082BB15 ,  5D378KK02 ,  5D378KK03 ,  5D378KK05 ,  5D378MM02 ,  5D378MM14
引用特許:
審査官引用 (1件)
引用文献:
審査官引用 (2件)

前のページに戻る