特許
J-GLOBAL ID:200903035161699911

音声識別装置、発音矯正装置およびこれらの方法

発明者:
出願人/特許権者:
代理人 (1件): 坂口 博 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-253449
公開番号(公開出願番号):特開平11-202889
出願日: 1998年09月08日
公開日(公表日): 1999年07月30日
要約:
【要約】【課題】例えば、ノン・ネイティブの英語の発音から、正確に英単語を識別する音声識別装置およびその方法を提供することを目的とする。【解決手段】ベクトルデータ生成部160およびラベル作成部182は、日本人が発音した英語の1センテンス分の音声データを処理し、ラベル列に変換する。候補単語作成部184は、1センテンス分のラベル列を、それぞれ1つ以上の英単語から構成される第1の候補単語に対応付ける。類似単語追加部186は、単語データベース部160を用いて、第1の候補単語の発音に類似する英単語、例えば、第1の候補単語readに対する類似単語lead(日本人は一般にlとrとを区別して発音しずらい)を検索し、得られた類似単語を第1の候補単語に付加して第2の候補単語とする。絞り込み部188は、ユーザの操作に応じて第2の候補単語のいずれかを最終的な識別結果として選択し、選択した英単語を接続して英文のテキストデータとして出力する。
請求項(抜粋):
話し声に含まれる1つ以上の単語を示す音声データから、前記単語それぞれを識別する音声識別装置であって、1つ以上の前記単語の音声データそれぞれに、これら1つ以上の音声データそれぞれを識別して得られる1つ以上の前記単語の組み合わせの候補(候補単語)の1組以上を対応付ける候補単語対応付け手段と、1つ以上の前記単語の音声データそれぞれに対応付けた前記候補単語それぞれに、前記候補単語それぞれの発音に対応しうる1つ以上の前記単語の組み合わせ(類似単語)の0組以上を対応付ける類似単語対応付け手段と、1つ以上の前記単語の音声データそれぞれに対応付けた前記候補単語、および、前記候補単語それぞれに対応付けた前記類似単語のいずれかを選択し、前記単語の音声データそれぞれの識別結果とする音声データ識別手段とを有する音声識別装置。
IPC (5件):
G10L 3/00 561 ,  G10L 3/00 551 ,  G06F 3/16 320 ,  G09B 7/02 ,  G09B 19/04
FI (5件):
G10L 3/00 561 F ,  G10L 3/00 551 E ,  G06F 3/16 320 H ,  G09B 7/02 ,  G09B 19/04
引用特許:
出願人引用 (5件)
  • 音声認識装置および音声認識方法
    公報種別:公開公報   出願番号:特願平5-150712   出願人:株式会社日立製作所
  • 発音学習装置
    公報種別:公開公報   出願番号:特願平4-239835   出願人:大阪瓦斯株式会社, 沖電気工業株式会社
  • 特開昭61-026133
全件表示
審査官引用 (7件)
  • 補完音声認識装置
    公報種別:公開公報   出願番号:特願平5-177818   出願人:大阪瓦斯株式会社, 沖電気工業株式会社
  • 音声認識装置および音声認識方法
    公報種別:公開公報   出願番号:特願平5-150712   出願人:株式会社日立製作所
  • 発音学習装置
    公報種別:公開公報   出願番号:特願平4-239835   出願人:大阪瓦斯株式会社, 沖電気工業株式会社
全件表示

前のページに戻る