Pat
J-GLOBAL ID:200903073112678991
データベース管理装置およびデータベース管理方法
Inventor:
,
,
,
,
Applicant, Patent owner:
Agent (1):
外川 英明
Gazette classification:公開公報
Application number (International application number):2001299138
Publication number (International publication number):2003108576
Application date: Sep. 28, 2001
Publication date: Apr. 11, 2003
Summary:
【要約】【課題】 分類の精度を維持しながら、データベースのメンテナンスを行うことのできる文書分類装置および文書分類方法を提供する。【解決手段】 ユーザが予め所定の分野に属することが分かっている分類文書で分類動作を行い、分類文書とデータベースに登録されている文書(以下「登録文書」と表記する)間の類似度と確度を算出する。これらを元に、登録文書の登録分野と、分類文書の分野が一致していた場合と異なっていた場合に、それぞれ正解影響度と不正解影響度を算出し、登録文書ごとに蓄積する。この操作を分類文書を複数種用いて繰り返す。蓄積した正解影響度と不正解影響度から登録文書毎の削除文書候補点数を算出する。この削除文書候補点数が大きい文書を削除文書候補として抽出する
Claim (excerpt):
分野情報を有する登録文書を記録したデータベースを管理する管理装置であって、所定の文書を入力する第一入力手段と、前記データベースに登録された登録文書を読み込む読み込み手段と、前記所定の文書と前記登録文書との間の類似度を算出する類似度算出手段と、前記類似度算出手段により算出された類似度をもとに、確度を算出する確度算出手段と、前記所定の文書の属する分野を入力する第二入力手段と、前記所定の文書の属する分野と、前記登録文書が登録されている分野との一致/不一致を判別する判別手段と、前記判別手段が前記所定の文書の属する分野と、前記登録文書が登録されている分野とが一致していると判別した場合、前記類似度と前記確度をもとに正解影響度を算出する正解影響度算出手段と、前記判別手段が前記所定の文書の属する分野と、前記登録文書が登録されている分野とが一致していないと判別した場合、前記類似度と前記確度をもとに不正解影響度を算出する正解影響度算出手段と、前記正解影響度及び前記不正解影響度から削除文書候補点数を算出する削除文書候補点数算出手段とを具備することを特徴とするデータベース管理装置。
IPC (4):
G06F 17/30 240
, G06F 17/30 170
, G06F 17/30 210
, G06F 17/30 350
FI (4):
G06F 17/30 240 A
, G06F 17/30 170 A
, G06F 17/30 210 D
, G06F 17/30 350 C
F-Term (6):
5B075ND03
, 5B075NK32
, 5B075PQ36
, 5B075QM07
, 5B075QM08
, 5B075UU06
Patent cited by the Patent:
Cited by examiner (3)
-
文書分類装置、文書分類方法、及びデータベース更新方法
Gazette classification:公開公報
Application number:特願平11-335442
Applicant:株式会社東芝, 東芝コンピュータエンジニアリング株式会社
-
類似文書検索装置および類似文書検索方法
Gazette classification:公開公報
Application number:特願平11-120023
Applicant:株式会社東芝, 東芝コンピュータエンジニアリング株式会社
-
類似文書検索装置及び類似文書検索方法
Gazette classification:公開公報
Application number:特願平9-231363
Applicant:株式会社東芝, 東芝コンピュータエンジニアリング株式会社
Return to Previous Page