特許
J-GLOBAL ID:200903063982373384

音声符号化における有声音と無声音の識別方法

発明者:
出願人/特許権者:
代理人 (1件): 竹本 松司 (外4名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-032623
公開番号(公開出願番号):特開平10-222194
出願日: 1997年02月03日
公開日(公表日): 1998年08月21日
要約:
【要約】【課題】 音声符号化における有声音と無声音の識別方法の提供。【解決手段】 入力音声の音声フレームデータを四つのサブフレームに分割し、さらに各サブフレームに対して有声音か無声音かの判別を以下のように行う。各サブフレームのNC値を高臨界値と低臨界値とそれぞれ比較し、安定か不安定かの判別ステップで該サブフレームのエネルギー量値とLSP係数値の大きさをそれぞれ判別し、両者が設定された臨界値より大きければ、サブフレームの低周波数帯域対高周波数帯域エネルギー比率(LOH)の判別ステップを行い、LOH値判別ステップ中で各サブフレームがある臨界値以上か否かを判定し、イエスであればサブフレームを有声音信号と、ノーであれば無声音信号と判別する。
請求項(抜粋):
一種の音声符号化における有声音と無声音の識別方法であって、入力音声の音声フレームデータの属性を識別するのに用いられる方法であり、該方法は以下のaからfのステップを包括する、a.現在の入力音声の音声フレームデータを四つのサブフレームに分割する、b.四つのサブフレームの正規化相互相関値(Normalized Cross correlation Value)、即ちNC値が一つの高臨界値以上であるか否かを判別し、もし判別結果がイエスであれば、入力された現在の音声フレーム中の四つのサブフレームがいずれも有声音信号であると判定する、c.もし上記bのステップでサブフレームのNC値が高臨界値以上でなければ、該NC値が一つの低臨界値より小さいか否かを判別し、もしイエスであれば、該音声フレーム中の四つのサブフレームがいずれも無声音信号に属すると判定する、d.もし上記cのステップでNC値が低臨界値より小さくないと判別されたなら、安定か不安定かの判別ステップを執行し、該サブフレームのエネルギー量値と線スペクトル対偶(line Spectrum Pair)係数値、即ちLSP係数値の大きさをそれぞれ判別する、e.もしエネルギー量値とLSP係数値が設定された臨界値より大きくなければ、音声信号が安定状態を呈すると判定し、四つのサブフレームの属性全部を前の一つの音声フレーム中の最後の一つのサブフレームの有声音か無声音の状態と同じと設定し、f.上述のeのステップ中で、もしエネルギー量値とLSP係数値が設定された臨界値より大きければ、該サブフレームの低周波数帯域対高周波数帯域エネルギー比率(Low to High Band Energy Ratio Value)、即ちLOH値の判別ステップを執行し、各一つのLOH値に対してある臨界値より大きいか否かを判定し、もし臨界値より大きければ、該サブフレームを有声音信号と判定し、もし大きくなければ該サブフレームを無声音の信号と判定し、次の一つのサブフレームに判別を進行して、四つのサブフレームの全てに対する判別を終えて終了する、以上を特徴とする、音声符号化における有声音と無声音の識別方法。
IPC (2件):
G10L 9/14 ,  G10L 9/00
FI (2件):
G10L 9/14 C ,  G10L 9/00 C

前のページに戻る