特許
J-GLOBAL ID:200903050789194834

音声認識システム

発明者:
出願人/特許権者:
代理人 (1件): 深見 久郎 (外4名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-385277
公開番号(公開出願番号):特開2002-189494
出願日: 2000年12月19日
公開日(公表日): 2002年07月05日
要約:
【要約】【課題】 言い直し発話において、認識率を維持することが可能な音声認識システムを提供する。【解決手段】 特徴ベクトル抽出部30は、発話に対応する音声に基づいて、特徴情報を抽出する。探索部60は、特徴抽出部の出力を受けて、予め設定された音響モデルとのマッチングをとりつつ探索を行うことで音声認識を行う。音響モデルデータベース40は、探索部60の探索処理において使用される複数の音響モデルに対応するデータを格納する。音響モデルデータベース40は、マッチング手段の探索処理において、音節発声に対応して、所定の学習データから生成された複数の隠れマルコフモデルのうちの所定数をマルチパス化した探索が可能な態様で音響モデルを格納している。
請求項(抜粋):
音声認識システムであって、発話に対応する音声に基づいて、特徴情報を抽出するための特徴抽出手段と、前記特徴抽出部の出力を受けて、予め設定された音響モデルとのマッチングをとりつつ探索を行うことで音声認識を行うマッチング手段とを備え、前記マッチング手段は、前記マッチング手段の探索処理において使用される複数の前記音響モデルに対応するデータを格納する音響データ格納手段を含み、前記音響データ格納手段は、前記マッチング手段の探索処理において、音節発声に対応して、所定の学習データから生成された複数の隠れマルコフモデルのうちの所定数をマルチパス化した探索が可能な態様で前記音響モデルを格納する、音声認識システム。
IPC (2件):
G10L 15/14 ,  G10L 15/18
FI (2件):
G10L 3/00 535 Z ,  G10L 3/00 537 C
Fターム (1件):
5D015HH23

前のページに戻る