特許
J-GLOBAL ID:200903066834047299
音声入力装置
発明者:
出願人/特許権者:
代理人 (1件):
作田 康夫
公報種別:公開公報
出願番号(国際出願番号):特願平11-102162
公開番号(公開出願番号):特開2000-293195
出願日: 1999年04月09日
公開日(公表日): 2000年10月20日
要約:
【要約】【課題】 音声のみで認識誤りを訂正しようとした場合,発声全体を言い直すのは煩わしい。特に,桁数の多い連続数字や住所のような長い発声のうち,誤認識された一部のために全体を言い直すことは,非常に使い勝手が悪く,効率も悪い。本発明の目的は,音声認識を用いた音声入力装置において不可避な認識誤りが起きた場合にも,利用者に比較的少ない労力で,かつ音声のみで効率良く訂正ができるようなマンマシンインタフェースを備えた音声入力装置,あるいは,該音声入力装置を含む各種情報処理装置を提供することにある。【解決手段】 本発明では,訂正を意図する入力も可能とする認識対象辞書を生成する認識対象生成手段と,前の認識結果を保持し,訂正の意図が検出された場合には,保持していた認識結果を訂正して出力する結果保持手段とを備えることにより,前記課題を解決する。【効果】 本発明によれば,特に長い発声の認識結果に対する訂正が音声だけで簡単に行え,効率的に音声入力できるようになる。
請求項(抜粋):
音声を入力する音声入力手段と,入力した音声を指定された認識対象辞書の範囲内で認識する音声認識手段と,該音声認識手段の認識結果を保持する結果保持手段と,認識結果を出力する認識結果出力手段と,予め指定されている基本認識対象辞書などを元に前記音声認識手段が用いる認識対象辞書を生成する認識対象生成手段とからなり,前記認識対象生成手段は,結果保持手段から,訂正対象となり得る前発声の認識結果を受け取った場合には,前記基本認識対象辞書および前記認識結果から訂正対象辞書を生成し,該訂正対象辞書と,予め指定されている訂正用語辞書と,前記基本認識対象辞書を組み合わせて新たな認識対象辞書を作成し,前記結果保持手段は,前記認識結果に訂正用語を含んでいるかどうか判定し,前記認識結果に訂正用語を含んでいる場合には,該訂正用語の意図に対応した訂正を保持内容に対して施すと共に,訂正された結果を認識結果出力手段および認識対象生成手段に対して出力し,前記認識結果に訂正用語を含んでいない場合には,そのままの結果を認識結果出力手段および認識対象生成手段に対して出力する,ことを特徴とする音声入力装置。
IPC (5件):
G10L 15/22
, G06F 3/16 320
, G06F 3/16
, G10L 15/00
, G10L 15/28
FI (7件):
G10L 3/00 561 F
, G06F 3/16 320 H
, G06F 3/16 320 G
, G10L 3/00 551 Q
, G10L 3/00 551 H
, G10L 3/00 551 P
, G10L 3/00 561 E
Fターム (7件):
5D015AA01
, 5D015AA05
, 5D015KK01
, 9A001DD11
, 9A001EE02
, 9A001HH17
, 9A001KK46
引用特許:
審査官引用 (2件)
-
桁付き数値音声認識装置
公報種別:公開公報
出願番号:特願平6-049343
出願人:富士通株式会社
-
特開昭59-214899
前のページに戻る