特許
J-GLOBAL ID:200903064416015930

情報検出装置及び方法

発明者:
出願人/特許権者:
代理人 (1件): 小池 晃 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願2001-225050
公開番号(公開出願番号):特開2003-036087
出願日: 2001年07月25日
公開日(公表日): 2003年02月07日
要約:
【要約】【課題】 AVデータにおける話者の統計的な会話頻度を検出する際に、背景雑音や複数話者による混合音声が多く含まれる部分の認識誤りを低減させる。【解決手段】 情報検出装置10では、入力部11から入力されたAVデータの音声信号D11は、LPC分析部12においてLPC分析が施される。有声音判定部14で有声音ブロックと判定されたブロックのLPC係数は、ケプストラム変換部17に入力され、LPCケプストラム係数に変換される。そのLPCケプストラム係数D12は、ベクトル量子化部18でベクトル量子化が施され、その量子化歪みD18は、話者識別部19に入力されて評価され、所定の認識ブロック毎に話者の識別及び判定が行われる。識別された話者D20は、話者判別頻度計算部20に入力され、所定の評価区間毎に区間内の各話者の認識された話者判別頻度が計算され、話者の出現頻度情報D21として出力される。
請求項(抜粋):
所定の情報源から所定の情報を検出するための情報検出装置において、上記情報源に含まれる音声信号を分析して話者の有声音部分を検出する有声音ブロック検出手段と、検出された有声音ブロックを用いて上記音声信号の特徴量の類似性によって所定の評価区間ごとに話者を識別する話者識別手段と、上記評価区間毎に識別された上記話者の判別頻度情報を、所定の頻度区間毎に求める話者判別頻度計算手段とを備え、上記頻度区間における上記話者の出現頻度情報を検出することを特徴とする情報検出装置。
IPC (6件):
G10L 11/06 ,  G10L 15/00 ,  G10L 15/02 ,  G10L 15/06 ,  G10L 15/10 ,  G10L 17/00
FI (8件):
G10L 3/00 515 D ,  G10L 3/00 521 P ,  G10L 3/00 521 U ,  G10L 3/00 531 F ,  G10L 3/00 551 G ,  G10L 3/00 545 A ,  G10L 9/08 301 A ,  G10L 9/12 301 A
Fターム (4件):
5D015AA03 ,  5D015DD01 ,  5D015HH04 ,  5D015LL05
引用特許:
審査官引用 (6件)
全件表示

前のページに戻る