Pat
J-GLOBAL ID:200903045028640284
音声認識装置,音声認識方法及び音声認識プログラムが記録された記録媒体
Inventor:
,
Applicant, Patent owner:
Agent (1):
田澤 博昭 (外1名)
Gazette classification:公開公報
Application number (International application number):1999260926
Publication number (International publication number):2001083985
Application date: Sep. 14, 1999
Publication date: Mar. 30, 2001
Summary:
【要約】【課題】 計算時間が長い尤度の計算を各音響辞書毎に実施する必要があるため、選択対象となる音響辞書の個数が増えると、音響辞書の選択に長時間を要する課題があった。【解決手段】 認識結果を音響モデルの系列に変換して、各音響モデルLab(i)に対応する平均継続時間長Tm(i)を継続時間辞書17から検索すると、その平均継続時間長Tm(i)にしたがって時系列データと各音響モデルの対応付けを実施し、その対応関係に基づいて上記時系列データと各音響辞書に係る距離値を求め、最小距離値の音響辞書を参照対象に選択する。
Claim (excerpt):
複数の音響モデルから構成された音響辞書を複数個記憶するとともに、複数の語彙を記憶する辞書記憶手段と、入力音声を音響分析して時系列データを出力する音響分析手段と、上記辞書記憶手段に記憶されている複数の音響辞書のうち参照対象に指定された音響辞書を参照して、上記時系列データに対する各語彙の尤度を計算し、最大尤度の語彙を認識結果として出力する語彙認識手段と、上記語彙認識手段の認識結果を音響モデルの系列に変換して、各音響モデルに対応する平均継続時間長を継続時間辞書から検索し、その平均継続時間長にしたがって上記時系列データと各音響モデルの対応付けを実施するセグメンテーション手段と、上記セグメンテーション手段が出力する対応関係に基づいて上記時系列データと各音響辞書に係る距離値を求め、最小距離値の音響辞書を参照対象に選択する辞書選択手段とを備えた音声認識装置。
IPC (2):
FI (2):
G10L 3/00 531 K
, G10L 3/00 515 C
F-Term (5):
5D015AA03
, 5D015DD03
, 5D015HH06
, 5D015HH13
, 5D015HH23
Patent cited by the Patent:
Cited by examiner (6)
-
音声認識方法及び音声認識装置
Gazette classification:公開公報
Application number:特願平6-050296
Applicant:株式会社エイ・ティ・アール音声翻訳通信研究所
-
特開平3-228100
-
単語予備選択方式
Gazette classification:公開公報
Application number:特願平5-051605
Applicant:株式会社エイ・ティ・アール自動翻訳電話研究所
-
音声認識装置および音声認識方法
Gazette classification:公開公報
Application number:特願平8-117444
Applicant:オムロン株式会社
-
音声認識による話者特徴判別方法
Gazette classification:公開公報
Application number:特願平8-210833
Applicant:三洋電機株式会社
-
特開昭61-184597
Show all
Return to Previous Page