特許
J-GLOBAL ID:201503000907623818
音声認識装置及び音声認識プログラム
発明者:
出願人/特許権者:
代理人 (1件):
特許業務法人 サトー国際特許事務所
公報種別:公開公報
出願番号(国際出願番号):特願2013-262482
公開番号(公開出願番号):特開2015-118307
出願日: 2013年12月19日
公開日(公表日): 2015年06月25日
要約:
【課題】ユーザから発話された認識語の音声を入力するマイクロホンとは別のマイクロホンを必要とせずに、認識語の音声データの認識率低下を回避する。【解決手段】音声認識装置1において、音声ドライバ8は、出力したガイダンス音声データをリファレンス音声データとして入力し、その入力したファレンス音声データを音認コア10に出力する。音声認識エンジン12は、ガイダンス音声に変換される前のガイダンス音声データをリファレンス音声データとして用い、スピーカ23から出力されたガイダンス音声がマイクロホン17に入力された場合でも、そのガイダンス音声が変換されたガイダンス音声データを、そのリファレンス音声データを用いて除去する。【選択図】図1
請求項(抜粋):
ガイダンス音声データを出力するガイダンス音声データ出力手段(8)と、
前記ガイダンス音声データ出力手段から出力されたガイダンス音声データをガイダンス音声に変換して出力する音声出力手段(23)と、
音声を入力し、その入力した音声を音声データに変換する音声入力手段(17)と、
音声データを入力する音声データ入力手段(10)と、
ユーザから発話された認識語の音声が前記音声入力手段に入力されたことで、認識語の音声データが前記音声データ入力手段に入力された場合に、その認識語の音声データを音声認識する音声認識手段(12)と、を備え、
前記音声データ入力手段は、前記ガイダンス音声データ出力手段から出力されたガイダンス音声データをリファレンス音声データとして入力し、
前記音声認識手段は、前記音声出力手段から出力されたガイダンス音声が前記音声入力手段に入力されたことで、ガイダンス音声データが前記音声データ入力手段に入力された場合に、その入力されたガイダンス音声データを、前記音声データ入力手段に入力されたリファレンス音声データを用いて除去する処理を行うことを特徴とする音声認識装置(1)。
IPC (3件):
G10L 15/20
, G10L 15/28
, G10L 13/00
FI (4件):
G10L15/20 370Z
, G10L15/28 230K
, G10L13/00 100C
, G10L13/00 100M
引用特許:
出願人引用 (6件)
-
音声対話装置
公報種別:公開公報
出願番号:特願2010-084328
出願人:株式会社東芝
-
エコ-消去装置及び方法、並びに音声再生装置
公報種別:公開公報
出願番号:特願平11-007004
出願人:ソニー株式会社
-
信号処理装置
公報種別:公開公報
出願番号:特願2012-144135
出願人:株式会社東芝
-
音声起動システム及びその実現方法
公報種別:公開公報
出願番号:特願平4-185690
出願人:アメリカンテレフォンアンドテレグラフカムパニー
-
音声判別装置
公報種別:公開公報
出願番号:特願2010-073700
出願人:株式会社東芝
-
音声認識装置
公報種別:公開公報
出願番号:特願2006-117300
出願人:アルパイン株式会社
全件表示
審査官引用 (6件)
-
音声判別装置
公報種別:公開公報
出願番号:特願2010-073700
出願人:株式会社東芝
-
音声対話装置
公報種別:公開公報
出願番号:特願2010-084328
出願人:株式会社東芝
-
音声認識装置
公報種別:公開公報
出願番号:特願2006-117300
出願人:アルパイン株式会社
全件表示
前のページに戻る