特許
J-GLOBAL ID:200903074907557579
音声認識方法及び装置
発明者:
出願人/特許権者:
代理人 (1件):
蔵合 正博
公報種別:公開公報
出願番号(国際出願番号):特願平11-173818
公開番号(公開出願番号):特開2001-005482
出願日: 1999年06月21日
公開日(公表日): 2001年01月12日
要約:
【要約】【課題】 複数の話者が発声した音声が入力された場合に、より高性能な音声認識結果を出力する。【解決手段】 入力された音声から音声を発話した話者が過去に認識した発話者であるのか、初めて認識をする発話者であるかを判定する話者判定手段2を備えるとともに、この話者判定手段2で処理された結果をパラメータ記憶手段3に渡し、話者ごとに認識パラメータを作成して記憶できるようにする。また、パラメータ記憶手段3に記憶された各話者ごとの認識パラメータは、音声認識手段1で音声認識処理を繰り返すことによって各話者に最適な認識パラメータとなるようにパラメータ更新手段4で適応化される。
請求項(抜粋):
音声信号から発声した内容及び発話者を認識する音声認識方法であって、入力された音声信号から発話者が過去に認識した話者であるか新規に認識する話者であるかを判定するステップと、前記発話者が新規に認識する話者であると判定された場合に、その発話者と認識パラメータとを関連づけて記憶し、出力するとともに、前記発話者が過去に認識した話者であると判定された場合に、その話者と関連づけられた認識パラメータを出力するステップと、前記入力された音声信号と前記出力された認識パラメータとから音声認識処理を行い、認識結果を出力するステップと、前記音声認識結果から前記認識パラメータを逐次更新するステップとを備えたことを特徴とする音声認識方法。
IPC (3件):
G10L 15/10
, G10L 15/28
, G10L 15/18
FI (3件):
G10L 3/00 531 K
, G10L 3/00 511
, G10L 3/00 537 Z
Fターム (7件):
5D015AA03
, 5D015DD02
, 5D015HH00
, 5D015HH03
, 5D015HH07
, 5D015HH21
, 5D015KK04
引用特許:
審査官引用 (7件)
-
特開平4-301695
-
話者適応音声認識装置
公報種別:公開公報
出願番号:特願平3-198179
出願人:富士通株式会社
-
音声認識装置
公報種別:公開公報
出願番号:特願平7-289818
出願人:株式会社エイ・ティ・アール音声翻訳通信研究所
全件表示
前のページに戻る