特許
J-GLOBAL ID:200903045590250332

認識されたテキスト中の音声シーケンスと手動入力される補正ワードの音声転写との比較を通した音声認識により認識されたテキストの補正

発明者:
出願人/特許権者:
代理人 (3件): 津軽 進 ,  宮崎 昭彦 ,  笛田 秀仙
公報種別:公表公報
出願番号(国際出願番号):特願2003-529447
公開番号(公開出願番号):特表2005-503590
出願日: 2002年09月10日
公開日(公表日): 2005年02月03日
要約:
音声認識装置(2)用の補正装置(4)が提供され、これによって認識されたテキスト(ETI)の間違って認識されたワード(FETI)の置き換えが特に簡潔に実行される。補正装置(4)は、間違って認識されたワード及び実際に認識されるべき話されたワードの音素シーケンスが非常に似ているという認識に基づいており、ユーザによって入力される補正ワード(KWI)の音素シーケンスに似ている音素シーケンスを示す認識されたテキスト(ETI)中のワードを自動的にマークする。
請求項(抜粋):
話されたテキストに関する音声認識装置によって認識されたテキストを補正するための補正装置であって、前記話されたテキストの話されたワードに関する前記認識されたテキストが正しく認識されたワード及び間違って認識されたワードを含む、補正装置であって、 前記間違って認識されたワードの少なくとも1つを少なくとも1つの補正ワードと置き換えるために、手動入力される前記少なくとも1つの補正ワードを受け取るための入力手段と、 少なくとも前記入力された補正ワードを音素シーケンスに音声学的に転写するためのトランスクリプション手段と、 前記認識されたテキストの前記ワードの音素シーケンスの中の前記少なくとも1つの補正ワードの前記音素シーケンスを見つけ出し、ワードの音素シーケンスが前記少なくとも1つの補正ワードの前記音素シーケンスと本質的に合致する前記認識されたテキスト中の少なくとも1つの該ワードの位置を識別する位置情報を出すためのサーチ手段と、 前記認識されたテキスト情報の中の前記位置情報によって識別される前記少なくとも1つのワードのマーキングを可能にするように前記位置情報を送出するための出力手段と、 を有する補正装置。
IPC (4件):
G10L15/22 ,  G10L15/00 ,  G10L15/24 ,  G10L15/28
FI (5件):
G10L3/00 561F ,  G10L3/00 571R ,  G10L3/00 561C ,  G10L3/00 551B ,  G10L3/00 551P
Fターム (5件):
5D015KK03 ,  5D015LL04 ,  5D015LL05 ,  5D015LL06 ,  5D015LL08

前のページに戻る