特許
J-GLOBAL ID:200903071298061821

音声認識装置及びコンピュータ読み取り可能な記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 小池 隆彌
公報種別:公開公報
出願番号(国際出願番号):特願平11-266475
公開番号(公開出願番号):特開2001-092477
出願日: 1999年09月21日
公開日(公表日): 2001年04月06日
要約:
【要約】【課題】 音声区間を正しく切り出せないため、正確な音声認識ができなかった。【解決手段】 入力された音声信号の音響パラメータを抽出する音響分析部12と、上記音響パラメータから音声区間と推定される区間を切り出す音声区間切り出し部15と、上記音響パラメータと無音を含む音韻パターンとの類似度を計算する類似度演算部13と、上記音声区間と推定される区間に対し、上記類似度に基づいて音声区間かノイズ区間かを判定する音声区間判定部16と、該音声区間判定部によって音声区間と判定された区間に対し、上記類似度と単語辞書とに基づいて単語照合を行う単語照合部17と、を有する。
請求項(抜粋):
入力された音声信号の音響パラメータを抽出する音響分析部と、上記音響パラメータから音声区間と推定される区間を切り出す音声区間切り出し部と、上記音響パラメータと無音を含む各音韻の音響パラメータとの類似度を計算する類似度演算部と、上記音声区間と推定される区間に対し、上記類似度に基づいて音声区間かノイズ区間かを判定する音声区間判定部と、該音声区間判定部によって音声区間と判定された区間に対し、上記類似度と単語辞書とに基づいて単語照合を行う単語照合部と、を有することを特徴とする音声認識装置。
IPC (3件):
G10L 11/02 ,  G10L 15/04 ,  G10L 15/10
FI (2件):
G10L 3/00 513 C ,  G10L 3/00 531 C
Fターム (3件):
5D015DD03 ,  5D015DD05 ,  5D015HH22
引用特許:
審査官引用 (7件)
全件表示

前のページに戻る