特許
J-GLOBAL ID:200903084227907287

音声画像認識翻訳装置

発明者:
出願人/特許権者:
代理人 (1件): 高田 幸彦 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-247939
公開番号(公開出願番号):特開平10-097280
出願日: 1996年09月19日
公開日(公表日): 1998年04月14日
要約:
【要約】【課題】入力された一連の会話音声から成る文を高精度で翻訳する。【解決手段】口の画像の特徴が文の文節の終わりを示した場合には、入力された一連の音声からなる該文の文節と判断すると共に該文節の終わりの文字や文字列を認識し、更に文節を示す印を付加することにより、会話音声を正確に認識して翻訳精度を高める。
請求項(抜粋):
音声と画像を取り込む手段と、取り込んだ音声データを記憶しておくメモリと、取り込んだ一連の音声に対して該音声の特徴を抽出し、音声認識処理を行う音声認識処理部と、取り込んだ画像データを記憶しておくメモリと、取り込んだ一連の画像に対して該画像の特徴を抽出し、画像認識処理を行う画像認識処理部と、音声認識及び画像認識された単語や文章の認識結果に対して翻訳したい単語や文章に翻訳する翻訳処理部とを備え、経時的に変化する音声の特徴と該音声の特徴に対応した画像の特徴の2つの相関関係から、入力された一連の音声からなる文の文節を認識し、かつ、文を構成する単語を認識することで音声認識及び翻訳する音声画像認識翻訳装置において、音声に対応する口の画像の特徴が文の文節の終わりを示した場合には、入力された一連の音声からなる該文の文節と判断すると共に該文節の終わりの文字や文字列を認識し、更に文節を示す印を付加することを特徴とする音声画像認識翻訳装置。
IPC (5件):
G10L 3/00 551 ,  G10L 3/00 513 ,  G10L 3/00 571 ,  G06F 3/16 320 ,  G06F 17/28
FI (6件):
G10L 3/00 551 C ,  G10L 3/00 513 Z ,  G10L 3/00 571 G ,  G06F 3/16 320 F ,  G06F 15/38 V ,  G06F 15/38 A

前のページに戻る