特許
J-GLOBAL ID:200903070783812782
ロバストな音声分類のための方法および装置
発明者:
出願人/特許権者:
代理人 (6件):
鈴江 武彦
, 河野 哲
, 中村 誠
, 福原 淑弘
, 村松 貞男
, 橋本 良郎
公報種別:公表公報
出願番号(国際出願番号):特願2002-548711
公開番号(公開出願番号):特表2004-515809
出願日: 2001年12月04日
公開日(公表日): 2004年05月27日
要約:
音声モードを変更して、マルチモードの可変ビットレートのコード化技術の最大の性能を可能にするためのロバストな分類のための音声分類技術(502ないし530)。音声分類器は、高い割合で音声セグメントを正確に分類し、最低ビットレートでコード化して、より低いビットレートの要件を満たす。高精度の音声分類により、平均のコード化ビットレートはより低くなり、デコードされた音声の品質はより高くなる。音声分類器は、各音声フレームごとに最大数のパラメータを検討して、各フレームごとに多数の正確な音声モード分類を生成する。音声分類器は、変化する環境条件のもとで、多数の音声モードを正確に分類する。音声分類器は、外部の構成要素から分類パラメータを入力して、入力パラメータから内部分類パラメータを生成して、正規化された自己相関係数の関数の閾値を設定して、信号環境にしたがってパラメータ解析器を選択して、パラメータを解析して、音声モードを分類する。【選択図】図2
請求項(抜粋):
音声分類方法であって、
外部の構成要素から音声分類器へ分類パラメータを入力することと、
音声分類器において、入力パラメータの少なくとも1つから、内部分類パラメータを生成することと、
正規化された自己相関係数の関数の閾値を設定して、信号環境にしたがってパラメータ解析器を選択することと、
入力パラメータおよび内部パラメータを解析して、音声モードの分類を生成することとが含まれる音声分類方法。
IPC (6件):
G10L11/06
, G10L11/04
, G10L15/02
, G10L15/20
, G10L19/12
, G10L21/02
FI (10件):
G10L9/00 C
, G10L9/08 301A
, G10L3/02 301D
, G10L9/12 301A
, G10L5/06 A
, G10L9/14 301A
, G10L9/00 301A
, G10L9/08 B
, G10L9/12 B
, G10L9/14 S
Fターム (4件):
5D015CC05
, 5D015FF00
, 5D015LL10
, 5D045CA01
引用特許: