特許
J-GLOBAL ID:200903073112678991
データベース管理装置およびデータベース管理方法
発明者:
,
,
,
,
出願人/特許権者:
代理人 (1件):
外川 英明
公報種別:公開公報
出願番号(国際出願番号):特願2001-299138
公開番号(公開出願番号):特開2003-108576
出願日: 2001年09月28日
公開日(公表日): 2003年04月11日
要約:
【要約】【課題】 分類の精度を維持しながら、データベースのメンテナンスを行うことのできる文書分類装置および文書分類方法を提供する。【解決手段】 ユーザが予め所定の分野に属することが分かっている分類文書で分類動作を行い、分類文書とデータベースに登録されている文書(以下「登録文書」と表記する)間の類似度と確度を算出する。これらを元に、登録文書の登録分野と、分類文書の分野が一致していた場合と異なっていた場合に、それぞれ正解影響度と不正解影響度を算出し、登録文書ごとに蓄積する。この操作を分類文書を複数種用いて繰り返す。蓄積した正解影響度と不正解影響度から登録文書毎の削除文書候補点数を算出する。この削除文書候補点数が大きい文書を削除文書候補として抽出する
請求項(抜粋):
分野情報を有する登録文書を記録したデータベースを管理する管理装置であって、所定の文書を入力する第一入力手段と、前記データベースに登録された登録文書を読み込む読み込み手段と、前記所定の文書と前記登録文書との間の類似度を算出する類似度算出手段と、前記類似度算出手段により算出された類似度をもとに、確度を算出する確度算出手段と、前記所定の文書の属する分野を入力する第二入力手段と、前記所定の文書の属する分野と、前記登録文書が登録されている分野との一致/不一致を判別する判別手段と、前記判別手段が前記所定の文書の属する分野と、前記登録文書が登録されている分野とが一致していると判別した場合、前記類似度と前記確度をもとに正解影響度を算出する正解影響度算出手段と、前記判別手段が前記所定の文書の属する分野と、前記登録文書が登録されている分野とが一致していないと判別した場合、前記類似度と前記確度をもとに不正解影響度を算出する正解影響度算出手段と、前記正解影響度及び前記不正解影響度から削除文書候補点数を算出する削除文書候補点数算出手段とを具備することを特徴とするデータベース管理装置。
IPC (4件):
G06F 17/30 240
, G06F 17/30 170
, G06F 17/30 210
, G06F 17/30 350
FI (4件):
G06F 17/30 240 A
, G06F 17/30 170 A
, G06F 17/30 210 D
, G06F 17/30 350 C
Fターム (6件):
5B075ND03
, 5B075NK32
, 5B075PQ36
, 5B075QM07
, 5B075QM08
, 5B075UU06
引用特許:
前のページに戻る