特許
J-GLOBAL ID:200903041609714550

項目抽出方法及び装置

発明者:
出願人/特許権者:
代理人 (1件): 中島 淳 (外5名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-337966
公開番号(公開出願番号):特開平7-200693
出願日: 1993年12月28日
公開日(公表日): 1995年08月04日
要約:
【要約】【目的】 高速、高精度で新戸籍形式に必要な項目を抽出する。【構成】戸籍文章データを入力し、変換パターン中の変数を入れ子構造とする戸籍文章パターン等と照合しているか否か判断する。照合するパターンが存在すれば、このパターンを変換パターンの対応する変数に置換し、データの終わりまでを覆う変換パターンが存在すると判断されるまで繰り返す(51 〜55) 。戸籍文章パターンが文末を示す変数Sに変換されているか判断して、正しい戸籍文章パターンの照合が得られたか否か判断する(56)。変数Sに変換されていない場合には、正しい戸籍文章パターンの照合が得られていないので、終了し、戸籍文章パターンが変数Sに置換されている場合には、変数Sに変換されたパターンが複数存在するか否か判断し、変換されたパターンが複数ある場合には、入れ子の数が最少の組合せによるパターンを選択する。抽出された戸籍文章パターンを変換パターンに従って項目化パターンに変換することにより項目を抽出する(57 〜59) 。
請求項(抜粋):
所定形式で表現されたテキスト文と予め定めた複数の変換パターンとの照合を行い、照合結果に基づいてテキスト文から項目を抽出する項目抽出装置であって、前記各変換パターンは、第1のパターンと、該第1のパターンの1つの文章の末尾を示しかつ第1のパターンを一文字で置換するための複数の変数であって、該変数のうちあるものは、1つの文章の末尾を示す末尾変数であるような複数の変数の中の1つの変数と、前記第1のパターンに対応しかつ前記テキスト文中の語句に対応する項目を備えた第2のパターンとによって構成されると共に、前記変換パターンの少なくとも1つは他の変換パターンの第1のパターンを置換する変数を組み込んだ入れ子構造の第1のパターンを有し、第1のパターンが前記末尾変数で置換されたとき1つの文章が正しく置換されたと判断して前記第1のパターンを前記第2のパターンに変換することにより項目を抽出する項目抽出装置。
IPC (2件):
G06F 17/60 ,  G06F 17/30
FI (2件):
G06F 15/21 Z ,  G06F 15/40 370 Z

前のページに戻る