Pat
J-GLOBAL ID:200903067635866392
音声処理装置、動画像処理装置、音声・動画像処理装置及び音声・動画像処理プログラムを記録した記録媒体
Inventor:
Applicant, Patent owner:
Agent (1):
平木 祐輔
Gazette classification:公開公報
Application number (International application number):2000193118
Publication number (International publication number):2002006874
Application date: Jun. 27, 2000
Publication date: Jan. 11, 2002
Summary:
【要約】 (修正有)【課題】 笑い声区間を自動的に、しかも少ない演算量とメモリサイズで抽出することができる音声処理装置と動画像から笑い動作区間を自動的に抽出することができる動画像処理装置を提供する。【解決手段】 音声処理装置10は、1フレーム毎に音声パワー、ピッチ、音声波の振幅、周波数スペクトルなどを格納するデータベース101、音声の区間を抽出する音声区間判定部102、抽出された音声の各区間のrms振幅値を求め、各区間の音圧変化の平均を計算する振幅判定部104、振幅判定部104の結果を閾値と比較し、該結果が閾値より大きい状態が所定時間続くときは区間が笑い声区間であると判定する音声認識部105、抽出した笑い声区間を格納する笑い声区間格納部106と、出力部107を備えることにより、音声信号から笑い声区間を抽出する。
Claim (excerpt):
音声を時間的に区分する区分手段と、前記区分手段により区分された音声の各区間の振幅情報から前記区間の音圧変化の平均を計算する計算手段と、前記計算手段の結果を所定の閾値と比較し、該計算手段の結果が前記閾値より大きく、かつ同じ音素が所定期間続くときは前記区間が笑い声区間であると判定する笑い声判定手段と、を備えることを特徴とする音声処理装置。
IPC (7):
G10L 11/02
, G10L 15/04
, G06F 3/16 320
, G06T 7/20 300
, G10L 15/10
, G10L 15/00
, G10L 15/28
FI (5):
G06F 3/16 320 A
, G06T 7/20 300 A
, G10L 3/00 513 A
, G10L 3/00 531 N
, G10L 3/00 551 P
F-Term (7):
5D015AA01
, 5D015BB02
, 5D015DD03
, 5D015HH03
, 5D015KK01
, 5L096HA03
, 5L096HA07
Patent cited by the Patent:
Cited by examiner (3)
-
特開平2-184880
-
統合認識対話装置
Gazette classification:公開公報
Application number:特願平7-038581
Applicant:シャープ株式会社, 技術研究組合新情報処理開発機構
-
映像分類方法および装置
Gazette classification:公開公報
Application number:特願平8-340293
Applicant:日本電信電話株式会社
Return to Previous Page