特許
J-GLOBAL ID:200903028173415785

撮像機能付き携帯電話機

発明者:
出願人/特許権者:
代理人 (1件): 福山 正博
公報種別:公開公報
出願番号(国際出願番号):特願2004-048998
公開番号(公開出願番号):特開2005-244394
出願日: 2004年02月25日
公開日(公表日): 2005年09月08日
要約:
【課題】通話者発声の品質が低下した場合であっても、通話者の唇部分の画像に基づく補正を有効に活用することによって音声出力の品質を著しく向上させる。【解決手段】音声入力は、音声解析部101によって解析して発声内容データに変換されて音声データ比較/補正部102に入力され、情報集積部13に入力される。画像入力は、画像解析部104によって解析され、そのデータを音声データ抽出部105に出力すると同時に、情報集積部13にも出力され、画像認識によって得られた文字データが音声データ比較/補正部102に出力される。情報集積部13は、音声と画像のデータに対して学習を行い、その結果データをメモリ蓄積する。音声の途切れや不明瞭部分が存在する場合には、学習蓄積データをもとに補正を加え、音声データ圧縮部103に出力し正確な音声情報を次段回路に送出する。【選択図】図2
請求項(抜粋):
通話者の発声を検出して得られた第1の音声データを、該通話者の唇部分を撮像して得られた画像データに基づいて生成された第2の音声データで補正した発声内容出力として送出し得る撮像機能付き携帯電話機において、 前記第1の音声データを解析して第1の発声内容データに変換し、 前記画像データを解析すると共に、該解析されたデータを学習して蓄積した第2の発声内容データを求め、 前記発声内容出力は、前記第1の発声内容データと前記第2の発声内容データを比較して両データが異なっていたときに前記第1の音声データを前記第2の音声データで補正して送出し得るように構成することを特徴とする撮像機能付き携帯電話機。
IPC (6件):
H04M1/00 ,  G06T7/20 ,  G10L15/00 ,  G10L15/20 ,  G10L15/24 ,  G10L19/00
FI (6件):
H04M1/00 H ,  G06T7/20 300B ,  G10L3/00 531P ,  G10L3/00 551A ,  G10L3/00 571Q ,  G10L9/00 N
Fターム (14件):
5D015AA01 ,  5D015BB02 ,  5D015CC17 ,  5D015HH23 ,  5D015KK02 ,  5D015LL04 ,  5K027AA11 ,  5K027BB03 ,  5K027DD16 ,  5K027HH26 ,  5L096BA16 ,  5L096CA04 ,  5L096HA02 ,  5L096KA04
引用特許:
出願人引用 (8件)
  • 情報処理方法及び装置
    公報種別:公開公報   出願番号:特願平5-155314   出願人:キヤノン株式会社
  • 移動体通信装置
    公報種別:公開公報   出願番号:特願2000-306995   出願人:松下電器産業株式会社
  • 特開昭60-188998公報([0000]〜[0000]、図2参照)
全件表示
審査官引用 (1件)
  • 音声情報入力装置
    公報種別:公開公報   出願番号:特願平11-120944   出願人:富士通株式会社

前のページに戻る