特許
J-GLOBAL ID:201303025323586250

音声認識装置、音声認識方法およびプログラム

発明者:
出願人/特許権者:
代理人 (1件): 片寄 恭三
公報種別:公開公報
出願番号(国際出願番号):特願2012-124247
公開番号(公開出願番号):特開2013-250379
出願日: 2012年05月31日
公開日(公表日): 2013年12月12日
要約:
【課題】 音声中に含まれる固有名詞に対して、その音響的特徴の抽出での誤りを補正してユーザ辞書との対比を行うことによって、その認識精度を改善させる「音声認識装置、音声認識方法およびプログラム」を提供する。【解決手段】 情報端末における音声認識装置100は、固有名称をその端末に対するユーザの利用状況に基づいて収集して、ユーザ辞書を作成する。入力された音声は、その音声波形に基づいて音声認識によるテキスト化され、そこから固有名詞に係るテキスト部位が抽出される。抽出されたテキスト部位における特定の文字は置き換えられ、1または複数の単語が生成される。これらの単語は前記ユーザ辞書で検索され、該当単語が含まれている場合には、前記固有名詞に係るテキスト部位は当該単語で置き換えられる。【選択図】 図1
請求項(抜粋):
情報端末における音声認識装置であって、 固有名称をその端末に対するユーザの利用状況に基づいて収集して、ユーザ辞書を作成 する手段と、 入力された音声を、その音声波形に基づいて音声認識しテキスト化する手段と、 前記テキスト化された音声から固有名詞に係るテキスト部位を抽出する手段と、 前記抽出されたテキスト部位における特定の文字を置き換えることにより、1または複 数の単語を生成する手段と、 前記ユーザ辞書に前記1または複数の単語が含まれている場合に、前記固有名詞に係る テキスト部位を当該単語で置き換える手段と、 を有する音声認識装置。
IPC (2件):
G10L 15/10 ,  G10L 15/00
FI (2件):
G10L15/10 300H ,  G10L15/00 200Q

前のページに戻る