特許
J-GLOBAL ID:200903046546015462

テキスト抽出処理装置及びテキスト抽出処理方法

発明者:
出願人/特許権者:
代理人 (1件): 鈴江 武彦
公報種別:公開公報
出願番号(国際出願番号):特願平7-133272
公開番号(公開出願番号):特開平8-329165
出願日: 1995年05月31日
公開日(公表日): 1996年12月13日
要約:
【要約】【目的】ユーザが任意に作成した文書から数値データを含む文字列を自動的に抽出し、その文字列から数値データを各項目に分類して集計処理を行う。【構成】処理対象となる文書が入力されると(301〜303)、その文書から特定のパターンを持つ文字列を数値データとして抽出し(304) 、さらに、その数値データの前後に存在する一定規則に基づいた文字列を数字文字列データとして抽出する(305) 。この数字文字列データの中から名詞データを抽出し、これを所定の項目毎に分類して、上記数値データを対応付ける(306) 。このようにして得られた各項目の数値データを1ヵ月等の所定期間毎に集計し(307) 、その集計結果データを表示する(303) 。
請求項(抜粋):
処理対象となる文書データを入力する文書入力手段と、この文書入力手段によって入力された上記文書データから数値データを抽出する数値データ抽出手段と、この数値データ抽出手段によって抽出された上記数値データに対応する数字文字列データを同文書データから抽出する数字文字列データ抽出手段と、この数字文字列データ抽出手段によって抽出された上記数字文字列データの中から名詞データを抽出する名詞データ抽出手段と、この名詞データ抽出手段によって抽出された上記名詞データを所定の項目毎に分類し、その項目毎に上記名詞データに関連する上記数値データを対応付けるデータ構造化手段と、このデータ構造化格手段によって各項目毎に対応付けられた上記数値データを所定期間毎に集計するデータ集計手段と、このデータ集計手段によって得られる集計結果データを表示する表示手段とを具備したことを特徴とするテキスト抽出処理装置。
IPC (2件):
G06F 19/00 ,  G06F 17/21
FI (2件):
G06F 15/22 310 Z ,  G06F 15/20 548 G

前のページに戻る