特許
J-GLOBAL ID:200903038357014258

編集中における音声カーソルとテキストカーソルの位置合わせ

発明者:
出願人/特許権者:
代理人 (3件): 伊東 忠彦 ,  大貫 進介 ,  伊東 忠重
公報種別:公表公報
出願番号(国際出願番号):特願2002-578284
公開番号(公開出願番号):特表2004-530205
出願日: 2002年03月25日
公開日(公表日): 2004年09月30日
要約:
音声認識装置は、ディクテーションの音声データを処理し、当該ディクテーションの認識テキスト情報及びリンク情報を生成する。音声認識装置の同期再生モードでは、ディクテーションの再生中、訂正装置は再生されている音声データに関連する認識テキスト情報のワードを音声カーソルによりマークする。音声認識装置において、ユーザが誤ったワードを認識したら、この誤ったワード上にテキストカーソルを置き、これを訂正する。カーソル同期手段は、テキストカーソルを音声カーソルの位置に合わせること、あるいは音声カーソルをテキストカーソルの位置に合わせることを可能にする。これにより各カーソルの位置決めを容易に行うことができるようになる。
請求項(抜粋):
音声情報から音声認識装置によって認識されたテキスト情報の誤ったワードを訂正する訂正装置であって: 前記音声情報、それに対応する認識テキスト情報及びリンク情報を受信する受信手段であって、該受信手段は前記認識テキスト情報の各ワードに対し、該ワードが前記音声認識装置により認識された前記音声情報の部分をマークする受信手段; 前記認識テキスト情報の誤ったワードにテキストカーソルを置き、ユーザにより入力された編集情報に従って前記誤ったワードを編集する編集手段; 前記音声情報の再生中、再生されている該音声情報に対し前記リンク情報によりマークされている前記認識テキスト情報のワードが音声カーソルの位置を示す間、同期してマークされる同期再生モードを可能にする同期再生手段;及び 前記テキストカーソルを前記音声カーソルに、あるいは前記音声カーソルを前記テキストカーソルに同期させるカーソル同期手段; からなることを特徴とする訂正装置。
IPC (4件):
G06F3/16 ,  G06F17/22 ,  G10L15/00 ,  G10L15/22
FI (4件):
G06F3/16 330C ,  G06F17/22 503 ,  G10L3/00 551B ,  G10L3/00 561E
Fターム (7件):
5B009KB01 ,  5B009QB05 ,  5B009RB12 ,  5B009SA03 ,  5D015LL04 ,  5D015LL05 ,  5D015LL08
引用特許:
審査官引用 (7件)
  • 特開平2-163819
  • 情報信号処理装置
    公報種別:公開公報   出願番号:特願平3-271386   出願人:オリンパス光学工業株式会社
  • 特開昭61-084771
全件表示

前のページに戻る