特許
J-GLOBAL ID:200903041744203493

事実データ統合方法および装置

発明者:
出願人/特許権者:
代理人 (1件): 長澤 俊一郎 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-310766
公開番号(公開出願番号):特開2001-134576
出願日: 1999年11月01日
公開日(公表日): 2001年05月18日
要約:
【要約】【課題】 テキスト中の誤った記述や抽出処理の誤りに起因する抽出データ中の誤りやバラツキの誤り部分を排除して、適切なデータの集積を行なうこと。【解決手段】 データ抽出部1により、対象とする事物、属性名、属性値の3つ組によって規定される事実データをテキストから抽出し、抽出された事実データについて、データ集計部2でテキスト全体にわたり同種のデータをまとめ、生起回数を集計する。不整合検出部3はデータ集計部2において集計されたデータ集合を走査して両立し得ない不整合データ群を検出し、正誤判定部4において、不整合データ群の中でどれが正しいデータであるかを判断する。最小データ集積部5は、正しいデータを集積して出力する。また、事実データをテキストから抽出する際にデータに信頼度を付与し、データに付与された信頼度を利用してデータ群中の各データの正誤の判断を行なうこともできる。
請求項(抜粋):
対象とする事物、属性名、属性値の3つ組によって規定される事実データをテキストから抽出し、抽出された事実データについて同種のデータをまとめて、テキスト全体にわたるデータ集計を行ない、集計されたデータ集合を走査して両立し得ない不整合データ群を検出し、不整合データ群においてどれが正しいデータであるかを判断し、誤りデータを排除して正しい事実データの統合を行うことを特徴とする事実データ統合方法。
FI (2件):
G06F 15/401 320 A ,  G06F 15/40 370 A
Fターム (3件):
5B075ND03 ,  5B075NR02 ,  5B075NS01
引用特許:
審査官引用 (1件)
  • 文書校正装置
    公報種別:公開公報   出願番号:特願平9-333902   出願人:富士通株式会社

前のページに戻る