Pat
J-GLOBAL ID:200903041609714550
項目抽出方法及び装置
Inventor:
,
Applicant, Patent owner:
Agent (1):
中島 淳 (外5名)
Gazette classification:公開公報
Application number (International application number):1993337966
Publication number (International publication number):1995200693
Application date: Dec. 28, 1993
Publication date: Aug. 04, 1995
Summary:
【要約】【目的】 高速、高精度で新戸籍形式に必要な項目を抽出する。【構成】戸籍文章データを入力し、変換パターン中の変数を入れ子構造とする戸籍文章パターン等と照合しているか否か判断する。照合するパターンが存在すれば、このパターンを変換パターンの対応する変数に置換し、データの終わりまでを覆う変換パターンが存在すると判断されるまで繰り返す(51 〜55) 。戸籍文章パターンが文末を示す変数Sに変換されているか判断して、正しい戸籍文章パターンの照合が得られたか否か判断する(56)。変数Sに変換されていない場合には、正しい戸籍文章パターンの照合が得られていないので、終了し、戸籍文章パターンが変数Sに置換されている場合には、変数Sに変換されたパターンが複数存在するか否か判断し、変換されたパターンが複数ある場合には、入れ子の数が最少の組合せによるパターンを選択する。抽出された戸籍文章パターンを変換パターンに従って項目化パターンに変換することにより項目を抽出する(57 〜59) 。
Claim (excerpt):
所定形式で表現されたテキスト文と予め定めた複数の変換パターンとの照合を行い、照合結果に基づいてテキスト文から項目を抽出する項目抽出装置であって、前記各変換パターンは、第1のパターンと、該第1のパターンの1つの文章の末尾を示しかつ第1のパターンを一文字で置換するための複数の変数であって、該変数のうちあるものは、1つの文章の末尾を示す末尾変数であるような複数の変数の中の1つの変数と、前記第1のパターンに対応しかつ前記テキスト文中の語句に対応する項目を備えた第2のパターンとによって構成されると共に、前記変換パターンの少なくとも1つは他の変換パターンの第1のパターンを置換する変数を組み込んだ入れ子構造の第1のパターンを有し、第1のパターンが前記末尾変数で置換されたとき1つの文章が正しく置換されたと判断して前記第1のパターンを前記第2のパターンに変換することにより項目を抽出する項目抽出装置。
IPC (2):
FI (2):
G06F 15/21 Z
, G06F 15/40 370 Z
Return to Previous Page