Pat
J-GLOBAL ID:200903074907557579

音声認識方法及び装置

Inventor:
Applicant, Patent owner:
Agent (1): 蔵合 正博
Gazette classification:公開公報
Application number (International application number):1999173818
Publication number (International publication number):2001005482
Application date: Jun. 21, 1999
Publication date: Jan. 12, 2001
Summary:
【要約】【課題】 複数の話者が発声した音声が入力された場合に、より高性能な音声認識結果を出力する。【解決手段】 入力された音声から音声を発話した話者が過去に認識した発話者であるのか、初めて認識をする発話者であるかを判定する話者判定手段2を備えるとともに、この話者判定手段2で処理された結果をパラメータ記憶手段3に渡し、話者ごとに認識パラメータを作成して記憶できるようにする。また、パラメータ記憶手段3に記憶された各話者ごとの認識パラメータは、音声認識手段1で音声認識処理を繰り返すことによって各話者に最適な認識パラメータとなるようにパラメータ更新手段4で適応化される。
Claim (excerpt):
音声信号から発声した内容及び発話者を認識する音声認識方法であって、入力された音声信号から発話者が過去に認識した話者であるか新規に認識する話者であるかを判定するステップと、前記発話者が新規に認識する話者であると判定された場合に、その発話者と認識パラメータとを関連づけて記憶し、出力するとともに、前記発話者が過去に認識した話者であると判定された場合に、その話者と関連づけられた認識パラメータを出力するステップと、前記入力された音声信号と前記出力された認識パラメータとから音声認識処理を行い、認識結果を出力するステップと、前記音声認識結果から前記認識パラメータを逐次更新するステップとを備えたことを特徴とする音声認識方法。
IPC (3):
G10L 15/10 ,  G10L 15/28 ,  G10L 15/18
FI (3):
G10L 3/00 531 K ,  G10L 3/00 511 ,  G10L 3/00 537 Z
F-Term (7):
5D015AA03 ,  5D015DD02 ,  5D015HH00 ,  5D015HH03 ,  5D015HH07 ,  5D015HH21 ,  5D015KK04
Patent cited by the Patent:
Cited by examiner (7)
  • 特開平4-301695
  • 話者適応音声認識装置
    Gazette classification:公開公報   Application number:特願平3-198179   Applicant:富士通株式会社
  • 音声認識装置
    Gazette classification:公開公報   Application number:特願平7-289818   Applicant:株式会社エイ・ティ・アール音声翻訳通信研究所
Show all

Return to Previous Page