特許
J-GLOBAL ID:201403064837471811

音声認識装置、音声認識システム、音声認識方法および音声認識プログラム

発明者:
出願人/特許権者:
代理人 (6件): 藤原 康高 ,  手塚 史展 ,  小林 幹雄 ,  山下 正成 ,  泉 剛司 ,  小川 百合香
公報種別:公開公報
出願番号(国際出願番号):特願2012-209151
公開番号(公開出願番号):特開2014-063088
出願日: 2012年09月24日
公開日(公表日): 2014年04月10日
要約:
【課題】発明が解決しようとする課題は、応答性が高く高精度な音声認識装置を開発することである。【解決手段】実施形態の音声認識装置は、認識手段と、送信手段と、受信手段と、認識結果生成手段と、認識結果記憶手段と、辞書更新手段とを備える。認識手段は、クライアント認識辞書を用いて、第1の認識結果を生成する。送信手段は、音声信号あるいは特徴量をサーバに送信する。受信手段は、サーバから第2の認識結果を受信する。認識結果生成手段は、第2の認識結果よりも先に第1の認識結果を取得した場合は、第1の認識結果を利用して第3の認識結果を生成し、それ以外の場合は、少なくとも第2の認識結果を利用して第3の認識結果を生成する。辞書更新手段は、第3の認識結果の履歴に第1の語彙と第1の語彙より過去に生成された第2の語彙とが含まれる場合、第1の語彙が第2の語彙よりも優先的に含まれるようにクライアント認識辞書を更新する。【選択図】図1
請求項(抜粋):
認識可能な語彙を定義したクライアント認識辞書を用いて、音声信号を認識して第1の認識結果を生成する認識手段と、 前記第1の認識結果が生成される前に、前記音声信号あるいは前記音声信号から抽出された特徴量をサーバに送信する送信手段と、 前記サーバで前記音声信号を認識した結果である第2の認識結果を受信する受信手段と、 前記第2の認識結果よりも先に前記第1の認識結果を取得した場合は、前記第1の認識結果を利用して第3の認識結果を生成し、それ以外の場合は、少なくとも前記第2の認識結果を利用して前記第3の認識結果を生成する認識結果生成手段と、 前記第3の認識結果を記憶する認識結果記憶手段と、 前記第3の認識結果の履歴を利用して前記クライアント認識辞書を更新する辞書更新手段とを備え、 前記辞書更新手段が、前記第3の認識結果の履歴に第1の語彙と前記第1の語彙より過去に生成された第2の語彙とが含まれる場合、前記第1の語彙が前記第2の語彙よりも優先的に前記クライアント認識辞書に含まれるように、前記クライアント認識辞書を更新する音声認識装置。
IPC (2件):
G10L 15/06 ,  G10L 15/30
FI (3件):
G10L15/06 300J ,  G10L15/28 210A ,  G10L15/06 400V
引用特許:
出願人引用 (4件)
全件表示
審査官引用 (4件)
全件表示

前のページに戻る