特許
J-GLOBAL ID:201003041331286910

音声認識装置および音声認識プログラム

発明者:
出願人/特許権者:
代理人 (2件): 磯野 道造 ,  多田 悦夫
公報種別:公開公報
出願番号(国際出願番号):特願2009-017524
公開番号(公開出願番号):特開2010-175765
出願日: 2009年01月29日
公開日(公表日): 2010年08月12日
要約:
【課題】操作者が行った音声認識誤りの修正をフィードバックして、認識誤りの再発を防止する音声認識装置を提供する。【解決手段】音声認識装置1は、修正された修正単語列の単語を予め定めた単語数分だけ記憶するキャッシュ記憶手段211と、キャッシュ記憶手段211に記憶されている単語がキャッシュ記憶手段211において出現する確率値をキャッシュスコアとして算出するキャッシュスコア算出手段212と、言語モデル12aから得られる単語の出現確率値である言語スコアに、キャッシュ記憶手段211に記憶されている当該単語の出現確率値であるキャッシュスコアを加算した修正言語スコアを生成する言語スコア修正手段221と、修正言語スコアに基づいて、接続確率値が最大となる単語列を音声認識結果として言語モデル12aの中から探索する探索手段232と、を備えることを特徴とする。【選択図】図3
請求項(抜粋):
発音辞書、音響モデルおよび言語モデルを用いた音声認識装置により音声信号を音声認識することで得られた文字列の認識誤りを、操作者が修正装置により修正し、音声認識結果として出力する音声認識システムにおける音声認識装置において、 前記修正装置において修正された修正文字列を入力し、当該修正文字列を構成する単語を予め定めた単語数分だけ記憶するキャッシュ記憶手段と、 前記キャッシュ記憶手段に記憶されている単語について、当該単語が前記キャッシュ記憶手段において出現する確率値をキャッシュスコアとして算出するキャッシュスコア算出手段と、 前記言語モデルから得られる単語の出現確率値である言語スコアに、前記キャッシュ記憶手段に記憶されている当該単語の出現確率値であるキャッシュスコアを加算することで、前記言語モデルから得られる単語の言語スコアを修正した修正言語スコアを生成する言語スコア修正手段と、 この言語スコア修正手段で生成された修正言語スコアに基づいて、接続確率値が最大となる単語列を前記音声認識結果として前記言語モデルの中から探索する探索手段と、 を備えることを特徴とする音声認識装置。
IPC (2件):
G10L 15/22 ,  G10L 15/10
FI (2件):
G10L15/22 470F ,  G10L15/10 300G
Fターム (1件):
5D015LL04
引用特許:
審査官引用 (6件)
全件表示
引用文献:
審査官引用 (2件)
  • "複数の話題言語モデルによる音声認識結果の事後統合"
  • "同一単語間距離を考慮した言語モデル適応の効果"

前のページに戻る