特許
J-GLOBAL ID:200903002571175019
音声認識方法
発明者:
,
出願人/特許権者:
代理人 (1件):
草野 卓
公報種別:公開公報
出願番号(国際出願番号):特願平4-179704
公開番号(公開出願番号):特開平6-027985
出願日: 1992年07月07日
公開日(公表日): 1994年02月04日
要約:
【要約】【目的】 認識性能を向上させる。【構成】 雑誌記事、旅行案内、会議登録などに関する各学習用テキストデータベースからそれぞれ音節、単語などの生起順序に関する統計的言語モデル6を予め用意しておき、発声タスク(発声音声の内容)のサンプルを用いてこれと類似した統計的言語モデルを選択部5で選択し、その選択した統計的言語モデル8を用いて、それまでの認識結果から次に出現されると予測される尤度の高い複数の候補ユニット(音節や単語)を選出し、これら選出した候補ユニットの標準パターンをメモリ4から取出し、これら各標準パターンと入力音声との類似度を求め、これら類似度とその候補ユニットの生起尤度との和を総合尤度とし、これが最も大きいものを認識結果として出力する。
請求項(抜粋):
入力音声を特徴パラメータの時系列とし、生起順序に関する統計的言語モデルを用いて、上記入力音声の特徴パラメータ時系列について、複数の音声認識候補を選出し、これらの各音声認識候補について、音声標準パターンと上記入力音声の特徴パラメータ時系列とをそれぞれ照合して、生起の尤度と類似の尤度との総合尤度の高い候補を認識結果とする音声認識方法において、異なるタスクの学習用テキストデータベースからそれぞれ作成された生起順序に関する統計的言語モデル群を予め用意しておき、発声するタスクのサンプルを用いて、発声タスク(発声する音声の内容)と類似した統計的言語モデルを上記統計的モデル群から選択し、その選択した統計的言語モデルを、上記複数の音声認識候補の選出に使用することを特徴とする音声認識方法。
前のページに戻る