特許
J-GLOBAL ID:200903038403424156
音声認識装置および方法、記録媒体、並びにプログラム
発明者:
出願人/特許権者:
代理人 (1件):
稲本 義雄
公報種別:公開公報
出願番号(国際出願番号):特願2001-382579
公開番号(公開出願番号):特開2003-186494
出願日: 2001年12月17日
公開日(公表日): 2003年07月04日
要約:
【要約】【課題】 未知語を含む入力音声を連続音声認識する。【解決手段】 ステップS1で、ディジタル音声信号の入力があると判定するまで待機する。ステップS2で、入力音声から未知語の検出を開始する。ステップS3で、未知語が検出されたか否かを判定し、未知語が検出された場合、ステップS4で、検出した未知語の音韻系列を取得する。ステップS5で、検出した未知語を認識用辞書に登録し、ステップS6で、追加登録した未知語「タロウ」を反映させて言語モデル8を更新する。ステップS3で、未知語が検出されない場合、ステップS7で、入力音声に対して連続音声認識を実行して対応する文字列を生成する。なお、ステップS3乃至S6の処理に引き続き、ステップS7以降の処理を実行するようにしてもよい。
請求項(抜粋):
認識用辞書および言語モデルを用い、入力音声を対応する単語列に変換する音声認識装置において、前記入力音声に含まれる未知語を検出する検出手段と、前記検出手段によって検出された前記未知語に対応する発音情報を取得する取得手段と、前記検出手段によって検出された前記未知語を新規語として、前記取得手段によって取得された前記発音情報とを対応付けて前記認識用辞書に登録する登録手段と、前記登録手段によって登録された前記新規語を反映させて前記言語モデルを更新する更新手段と、前記更新手段によって更新された前記言語モデルに基づき、前記未知語を含む前記入力音声に対応する単語列の言語スコアを算出する算出手段とを含むことを特徴とする音声認識装置。
IPC (3件):
G10L 15/06
, G10L 15/14
, G10L 15/18
FI (6件):
G10L 3/00 521 C
, G10L 3/00 535 Z
, G10L 3/00 537 C
, G10L 3/00 537 D
, G10L 3/00 537 E
, G10L 3/00 537 G
Fターム (3件):
5D015AA01
, 5D015GG03
, 5D015HH23
前のページに戻る