特許
J-GLOBAL ID:201003077755864845

音声認識装置および音声認識プログラム

発明者:
出願人/特許権者:
代理人 (2件): 山本 尚 ,  藤田 有三子
公報種別:公開公報
出願番号(国際出願番号):特願2008-220931
公開番号(公開出願番号):特開2010-054896
出願日: 2008年08月29日
公開日(公表日): 2010年03月11日
要約:
【課題】単語辞書を用いて、精度の高い音声認識を行うことができる音声認識装置および音声認識プログラムを提供する。【解決手段】来訪者が検知されると、受付装置から来訪者名および担当者名を質問する音声が出力される(S42)。質問に対する来訪者の応答が、複数のカテゴリに属する単語とその発音に関する情報の対応を示す汎用辞書と、担当者毎の分類に基づいて汎用辞書から作成された分割辞書とを参照して音声認識される。汎用辞書を参照して得られた認識結果と分割辞書を参照して得られた認識結果とに基づいて決定された最終結果が得られる(S44)。最終結果が認識失敗を示す結果であれば(S45:YES)、来訪者に対して再発話が促され(S47)、認識に成功していれば(S45:NO)、最終結果に含まれる担当者名が特定され(S52)、その担当者の連絡先が特定されて(S53)、通知処理が行われる(S54)。【選択図】図10
請求項(抜粋):
単語辞書を用いて音声の認識を行う音声認識装置であって、 話者の音声の入力を受け付ける音声入力手段から入力された前記音声の音声情報を取得する音声情報取得手段と、 複数のカテゴリの各々について、複数の単語と前記複数の単語の発音に関する情報との対応を示す辞書である汎用辞書を記憶する汎用辞書記憶手段に記憶された前記汎用辞書を用いて、前記音声情報取得手段によって取得された前記音声情報に基づいて前記音声の認識を行う第1の認識手段と、 前記複数のカテゴリのうち、属する単語の数が所定量以下であるカテゴリである基準カテゴリに属する複数の単語を分類し、前記汎用辞書から各分類に関連する前記複数の単語と前記複数の単語の発音に関する情報との対応の一部をそれぞれ抽出することにより作成された複数の分割辞書を記憶する分割辞書記憶手段に記憶された前記分割辞書を用いて、前記音声情報取得手段によって取得された前記音声情報に基づいて前記音声の認識を行う第2の認識手段と、 前記第1の認識手段の認識結果である第1の認識結果および前記第2の認識手段の認識結果である第2の認識結果に基づいて、前記音声の認識結果を決定する結果決定手段とを備えたことを特徴とする音声認識装置。
IPC (3件):
G10L 15/28 ,  G10L 15/00 ,  G10L 15/06
FI (3件):
G10L15/28 360A ,  G10L15/00 200S ,  G10L15/06 400V
Fターム (2件):
5D015GG03 ,  5D015HH15
引用特許:
出願人引用 (1件)

前のページに戻る