特許
J-GLOBAL ID:200903082277059187

内容抽出装置

発明者:
出願人/特許権者:
代理人 (1件): 森田 寛
公報種別:公開公報
出願番号(国際出願番号):特願平4-316706
公開番号(公開出願番号):特開平6-162102
出願日: 1992年11月26日
公開日(公表日): 1994年06月10日
要約:
【要約】【目的】電子化された文書中から,特定の内容を表した情報を抜き出して,データベースに保存する,検索に利用するなどの用途に使用する内容抽出装置に関し,抽出条件の中に,任意の文字列と一致するワイルドカードの記述を許して,しかも,複雑な条件も簡単に記述できる抽出パターンを用いて,情報抽出を行うことができるようにすることを目的とする。【構成】ワイルドカード項,サブパターン項,選言項,一般項の連糸接続で定義されるパターンの組み合わせで抽出パターンを定義しておき,抽出パターン解析手段2で抽出パターンを内部構造に変換し,被照合対象記号列が入力されると,照合処理起動手段3で固定位置照合処理手段4を起動し,固定位置照合処理手段4で抽出パターンの各項の種類に応じた照合処理を行うことにより,抽出パターンと被照合対象記号列との対応関係を決定して,必要な情報の抽出を行う。
請求項(抜粋):
あらかじめ定義された抽出パターンに基づいて,被照合対象記号列が前記抽出パターンと一致するか否かを判定し,一致した場合には前記被照合対象記号列のどの部分が一致したかを出力する内容抽出装置において,前記抽出パターンがトップパターンと複数のサブパターンとサブパターン名を介した参照接続とで定義され,前記サブパターンおよび前記トップパターンが,任意の記号列と一致することを表すワイルドカード項,サブパターン名で表されるサブパターン項,いくつかのサブパターンのうちの一つが一致したときに入力記号列に一致したとみなされる選言項または一般項の連糸接続で定義され,前記選言項がサブパターンの選言接続で定義され,前記一般項が終端記号列で定義される記述に基づく抽出パターンを入力する抽出パターン入力手段(1) と,前記抽出パターンを内部構造に変換する抽出パターン解析手段(2) と,前記抽出パターンの一部または全部である指定パターンと,被照合対象記号列の一部または全部である指定入力記号列が入力されると,指定パターン中の項間の連糸接続関係に基づいて,各項と指定入力記号列が指定パターンと一致するか否かを,ワイルドカード項,サブパターン名で表されるサブパターン項,選言項および一般項を含む項の種類に応じた照合により検出し,一致した場合には指定入力記号列のどの部分が一致したかを示す情報を出力する固定位置照合処理手段(4) と,被照合対象記号列が入力されると,該被照合対象記号列を前記固定位置照合処理手段(4) への指定入力記号列とし,前記抽出パターン解析手段(2) で内部構造に変換された抽出パターンを前記固定位置照合処理手段(4) への指定パターンとして,前記固定位置照合処理手段(4) を起動する照合処理起動手段(3) とを備えたことを特徴とする内容抽出装置。
IPC (2件):
G06F 15/40 510 ,  G06F 15/40 520
引用特許:
審査官引用 (1件)
  • 特開平4-090052

前のページに戻る