特許
J-GLOBAL ID:200903016520477780
ロボット装置、文字認識装置及び文字認識方法、並びに、制御プログラム及び記録媒体
発明者:
,
,
,
,
出願人/特許権者:
代理人 (1件):
小池 晃 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願2002-130905
公開番号(公開出願番号):特開2003-044080
出願日: 2002年05月02日
公開日(公表日): 2003年02月14日
要約:
【要約】【課題】 未登録の単語を新規単語として認識用辞書に登録する。【解決手段】 CCDカメラ20において撮像された画像の文字認識の結果から推定される複数の文字と、これら各文字から推定される複数の読み仮名と、各読み仮名に対応する読み方とを発音情報生成部150において生成し、ここで得られた複数の読み方とマイク23において取得したユーザからの発声とをマッチングすることによって、生成された複数候補の中から1つの読み仮名及び発音のしかた(読み方)を特定する。
請求項(抜粋):
内部状態に応じて自律的に動作するロボット装置において、単語と該単語の発音のしかたとの対応関係が音声認識用辞書として記憶された音声認識用記憶手段と、単語と該単語の表音文字との対応関係が単語表音テーブルとして記憶された単語表音記憶手段と、被写体を撮像する撮像手段と、上記撮像手段において撮像された画像から所定パターンの画像を抽出する画像認識手段と、周囲の音を取得する集音手段と、上記集音手段において取得された音から音声を認識する音声認識手段と、上記画像認識手段において抽出された上記所定パターンから推定される複数通りの表音文字を上記単語表音テーブルに基づいて付与し、上記付与された複数通りの表音文字の各々に対して発音のしかたと発音に相当する音声波形とを生成する発音情報生成手段と、上記発音情報生成手段において生成された各音声波形と上記音声認識手段において認識された音声の音声波形とを比較し、最も近い音声波形を上記画像認識手段において抽出されたパターン認識結果に対応する発音のしかたであるとして上記音声認識用辞書に新規に記憶する記憶制御手段とを備えることを特徴とするロボット装置。
IPC (7件):
G10L 15/06
, G06K 9/00
, G10L 15/00
, G10L 15/14
, G10L 15/20
, G10L 15/22
, G10L 15/24
FI (9件):
G06K 9/00 S
, G10L 3/00 521 C
, G10L 3/00 521 J
, G10L 3/00 535 Z
, G10L 3/00 551 H
, G10L 3/00 521 V
, G10L 3/00 571 Q
, G10L 3/00 571 T
, G10L 3/00 531 Q
Fターム (8件):
5B064AA07
, 5B064FA16
, 5D015GG03
, 5D015HH23
, 5D015KK02
, 5D015KK04
, 5D015LL07
, 5D015LL11
前のページに戻る