特許
J-GLOBAL ID:200903039982494949

統計的言語モデル生成装置および統計的言語モデル生成プログラム

発明者:
出願人/特許権者:
代理人 (1件): 磯野 道造
公報種別:公開公報
出願番号(国際出願番号):特願2001-172260
公開番号(公開出願番号):特開2002-366190
出願日: 2001年06月07日
公開日(公表日): 2002年12月20日
要約:
【要約】【課題】 音声認識における認識性能を向上することができ、発話内容に含まれやすい単語の出現確率を上げることができる統計的言語モデルを生成する統計的言語モデル生成装置および統計的言語モデル生成プログラムを提供する。【解決手段】 統計的言語モデル生成装置は、直近のテキストデータと過去の大量テキストデータとを音声として認識する音声認識手段7と、直近のテキストデータ(集積手段5)、および過去の大量テキストデータ(集積手段3)、ならびに音声認識手段7によって認識された認識結果を蓄積する蓄積手段9と、過去の大量のテキストデータに基づいて、n-gramの第一の確率重みを算出し、前記直近のテキストデータに基づいて、n-gramの第二の確率重みを算出し、前記認識結果に基づいて、n-gramの第三の確率重みを算出する確率重み算出手段と、第一の確率重み、および第二の確率重み、ならびに第三の確率重みに基づいて、統計的言語モデルを生成する言語モデル生成手段11とを備えた。
請求項(抜粋):
統計的言語モデルを生成する統計的言語モデル生成装置であって、出現頻度の高くなることが予測される単語を含む直近のテキストデータを取得するテキストデータ取得手段と、前記直近のテキストデータおよびこの直近のテキストデータよりデータ量の多い、それ以前の過去の大量テキストデータを音声として認識する音声認識手段と、前記直近のテキストデータ、前記過去の大量テキストデータ、前記音声認識手段による認識結果、を蓄積する蓄積手段と、前記過去の大量のテキストデータに基づいて、n-gramの第一の確率重みを算出し、前記直近のテキストデータに基づいて、n-gramの第二の確率重みを算出し、前記認識結果に基づいて、n-gramの第三の確率重みを算出する確率重み算出手段と、前記第一の確率重み、および前記第二の確率重み、ならびに前記第三の確率重みに基づいて、統計的言語モデルを生成する言語モデル生成手段と、を備えたことを特徴とする統計的言語モデル生成装置。
IPC (3件):
G10L 15/18 ,  G10L 15/06 ,  G10L 15/10
FI (3件):
G10L 3/00 537 D ,  G10L 3/00 521 F ,  G10L 3/00 531 G
Fターム (1件):
5D015HH00
引用特許:
審査官引用 (3件)

前のページに戻る