Pat
J-GLOBAL ID:200903084227907287
音声画像認識翻訳装置
Inventor:
,
,
,
,
,
,
Applicant, Patent owner:
Agent (1):
高田 幸彦 (外1名)
Gazette classification:公開公報
Application number (International application number):1996247939
Publication number (International publication number):1998097280
Application date: Sep. 19, 1996
Publication date: Apr. 14, 1998
Summary:
【要約】【課題】入力された一連の会話音声から成る文を高精度で翻訳する。【解決手段】口の画像の特徴が文の文節の終わりを示した場合には、入力された一連の音声からなる該文の文節と判断すると共に該文節の終わりの文字や文字列を認識し、更に文節を示す印を付加することにより、会話音声を正確に認識して翻訳精度を高める。
Claim (excerpt):
音声と画像を取り込む手段と、取り込んだ音声データを記憶しておくメモリと、取り込んだ一連の音声に対して該音声の特徴を抽出し、音声認識処理を行う音声認識処理部と、取り込んだ画像データを記憶しておくメモリと、取り込んだ一連の画像に対して該画像の特徴を抽出し、画像認識処理を行う画像認識処理部と、音声認識及び画像認識された単語や文章の認識結果に対して翻訳したい単語や文章に翻訳する翻訳処理部とを備え、経時的に変化する音声の特徴と該音声の特徴に対応した画像の特徴の2つの相関関係から、入力された一連の音声からなる文の文節を認識し、かつ、文を構成する単語を認識することで音声認識及び翻訳する音声画像認識翻訳装置において、音声に対応する口の画像の特徴が文の文節の終わりを示した場合には、入力された一連の音声からなる該文の文節と判断すると共に該文節の終わりの文字や文字列を認識し、更に文節を示す印を付加することを特徴とする音声画像認識翻訳装置。
IPC (5):
G10L 3/00 551
, G10L 3/00 513
, G10L 3/00 571
, G06F 3/16 320
, G06F 17/28
FI (6):
G10L 3/00 551 C
, G10L 3/00 513 Z
, G10L 3/00 571 G
, G06F 3/16 320 F
, G06F 15/38 V
, G06F 15/38 A
Return to Previous Page