特許
J-GLOBAL ID:200903014609080414

文字認識後処理方法および装置

発明者:
出願人/特許権者:
代理人 (1件): 谷 義一 (外3名)
公報種別:公開公報
出願番号(国際出願番号):特願平4-307006
公開番号(公開出願番号):特開平6-162274
出願日: 1992年11月17日
公開日(公表日): 1994年06月10日
要約:
【要約】【目的】 認識された日本語文字列に対し、単語辞書を用いないで、最適な候補文字を選択する。【構成】 文字は本来ある単語の一部であり、その単語は文章中における役割である品詞を持つ。したがって、文字にこの品詞が属性として付加されたと考えれば状態数が増加し、仮名、特に付属語の多くを構成する平仮名に対しては有効な制約となることが期待できる。逆に、漢字については個々の漢字を別状態とせず、各品詞状態を持つマクロ文字でもって代表して取扱い可能な程度の状態数に縮退させる。言い換えれば品詞という属性を仮名についてはより細かく分類するために用い、漢字については大分類のために用いて効果的制約と、状態数とのバランスをとるのが本発明の基本的概念である。本発明では認識の文字毎に対応付けた品詞についての文字間の接続関係を調べ最適な候補文字を選択する。
請求項(抜粋):
認識された日本語文字列に対し、最適な候補文字を選択する文字認識後処理方法において、文字列が認識されて各候補文字が順次得られる毎に、各候補文字が採り得る品詞を各候補文字毎に対応付けるステップと、品詞が対応付けられた各候補文字に対し、文字列中における当該候補文字の前の候補文字との接続関係を、これら文字間の文字の遷移確率および品詞の遷移確率を用いて評価するステップと、候補文字のうち前記接続関係が最適な候補文字を選択するステップとを有することを特徴とする文字認識後処理方法。

前のページに戻る