特許
J-GLOBAL ID:200903099645696818
音声認識装置、周波数スペクトル取得装置および音声認識方法
発明者:
,
,
,
出願人/特許権者:
,
代理人 (1件):
特許業務法人快友国際特許事務所
公報種別:公開公報
出願番号(国際出願番号):特願2006-068264
公開番号(公開出願番号):特開2007-248534
出願日: 2006年03月13日
公開日(公表日): 2007年09月27日
要約:
【課題】 少ない計算負荷で、マイクロホンの感度特性のばらつきの影響を受けずに、対話者の音声を鮮明に抽出して、正確な音声認識を行う技術を提供する。【解決手段】 対話者が話しかける音声から言語の内容を認識する音声認識装置であって、音を入力して音信号に変換する複数の音入力手段と、音信号を原周波数スペクトルに変換する周波数変換手段と、原周波数スペクトルから対話者の音声成分を含む1の基本周波数スペクトルを取得する音声成分検出手段と、複数の原周波数スペクトルからフィルタ行列を用いる独立成分分析によって1の雑音周波数スペクトルを取得する雑音成分推定手段と、基本周波数スペクトルから雑音周波数スペクトルを減算して音声周波数スペクトルを取得するスペクトル減算手段と、音声周波数スペクトルに基いて対話者が話しかけた言語の内容を認識する言語内容認識手段を備える。【選択図】 図2
請求項(抜粋):
対話者が話しかける音声から言語の内容を認識する音声認識装置であって、
音を入力して、音信号に変換する複数の音入力手段と、
音信号を周波数スペクトル(原周波数スペクトル)に変換する周波数変換手段と、
原周波数スペクトルから、対話者の音声成分を含む1の周波数スペクトル(基本周波数スペクトル)を取得する音声成分検出手段と、
複数の原周波数スペクトルから、フィルタ行列を用いる独立成分分析によって、雑音成分の1の周波数スペクトル(雑音周波数スペクトル)を取得する雑音成分推定手段と、
基本周波数スペクトルから雑音周波数スペクトルを減算して、対話者の音声成分の周波数スペクトル(音声周波数スペクトル)を取得するスペクトル減算手段と、
音声周波数スペクトルに基いて、対話者が話しかけた言語の内容を認識する言語内容認識手段を備える音声認識装置。
IPC (3件):
G10L 15/20
, G10L 21/02
, G06T 7/60
FI (5件):
G10L15/20 370D
, G10L21/02 101B
, G10L21/02 102B
, G10L15/20 380
, G06T7/60 150P
Fターム (5件):
5D015EE05
, 5L096BA02
, 5L096BA16
, 5L096CA05
, 5L096FA67
引用特許:
出願人引用 (6件)
全件表示
審査官引用 (5件)
全件表示
前のページに戻る