特許
J-GLOBAL ID:200903091758040241
音声認識文章入力装置
発明者:
,
,
,
出願人/特許権者:
代理人 (1件):
曾我 道照 (外4名)
公報種別:公開公報
出願番号(国際出願番号):特願2001-023736
公開番号(公開出願番号):特開2002-229585
出願日: 2001年01月31日
公開日(公表日): 2002年08月16日
要約:
【要約】【課題】 従来、特殊な用語や言い回しを含む専門文章の認識は困難であるという課題があった。【解決手段】 言語モデル3と、ユーザ固有の語彙を有するユーザ言語モデル3bと、音声を入力する音声入力手段2と、前記言語モデル及び前記ユーザ言語モデルを参照して単語列の尤度を計算して前記音声を文字に変換する音声文字変換手段4と、前記音声文字変換手段の出力文字の単語列を一時記憶するテキストバッファ5と、前記テキストバッファに一時記憶された文字を表示する表示手段6と、前記表示手段に表示された文字を修正してユーザテキストを作成する修正手段8と、前記ユーザテキストを解析して前記ユーザ言語モデルにユーザ固有の語彙を追加して更新するユーザ言語モデル学習手段10とを備えた。【効果】 ユーザ固有の語彙や表現をユーザ言語モデルに追加することができ、ユーザ固有の発話バリエーションに対応して認識性能を高めることができる。
請求項(抜粋):
単語のNグラムからなる言語モデルと、ユーザ固有の語彙を有し単語のNグラムからなるユーザ言語モデルと、音声を入力する音声入力手段と、前記言語モデル及び前記ユーザ言語モデルを参照して単語列の尤度を計算して前記音声を文字に変換する音声文字変換手段と、前記音声文字変換手段の出力文字の単語列を一時記憶するテキストバッファと、前記テキストバッファに一時記憶された文字を表示する表示手段と、前記表示手段に表示された文字を修正してユーザテキストを作成する修正手段と、前記ユーザテキストを解析して前記ユーザ言語モデルにユーザ固有の語彙を追加して更新するユーザ言語モデル学習手段とを備えたことを特徴とする音声認識文章入力装置。
IPC (3件):
G10L 15/06
, G10L 15/18
, G10L 15/00
FI (3件):
G10L 3/00 521 J
, G10L 3/00 537 D
, G10L 3/00 551 B
Fターム (2件):
引用特許:
引用文献: