特許
J-GLOBAL ID:200903085540988014

音声認識装置および方法

発明者:
出願人/特許権者:
代理人 (1件): 橘 和之
公報種別:公開公報
出願番号(国際出願番号):特願2003-127378
公開番号(公開出願番号):特開2004-333704
出願日: 2003年05月02日
公開日(公表日): 2004年11月25日
要約:
【課題】煩雑なボタン操作を行うことなく、音声認識の操作時間を短縮できるようにする。【解決手段】音声コマンドの発話音声およびスピーカ52からのトークバック音声が入力されるマイク53の位置での伝達系を模擬したフィルタ係数を設定し、トークバック音声x(n)をフィルタ処理することによってトークバック模擬音声y(n)を生成する適応フィルタ4と、マイク入力された混在音声からトークバック模擬音声y(n)を減算することによって発話音声を抽出する減算器5とを設け、発話音声とトークバック音声とが混在しているマイク入力音声からトークバック音声だけを減衰して音声認識エンジン54に供給するようにすることにより、発話のたびに発話ボタンを押してトークバックを中断させるといった面倒な操作をしなくても、トークバックの最中に音声入力を随時行うことができるようにする。【選択図】 図1
請求項(抜粋):
マイクから入力された発話音声を認識してスピーカからトークバックする機能を備えた音声認識装置であって、 上記スピーカから出力されたトークバック音声が上記マイクに入力される伝達系を模擬したフィルタ係数を設定し、上記スピーカから出力される前のトークバック音声をフィルタ処理することによって上記マイクの位置でのトークバック模擬音声を生成する適応フィルタ手段と、 上記マイクより入力された音声から上記トークバック模擬音声を減算することによって発話音声を抽出する発話音声抽出手段とを備えたことを特徴とする音声認識装置。
IPC (5件):
G10L21/02 ,  G10L15/00 ,  G10L15/20 ,  G10L15/22 ,  G10L15/28
FI (5件):
G10L3/02 301F ,  G10L3/00 551Q ,  G10L3/00 551P ,  G10L3/02 301C ,  G10L3/00 561D
Fターム (2件):
5D015EE04 ,  5D015KK02
引用特許:
審査官引用 (6件)
全件表示

前のページに戻る