特許
J-GLOBAL ID:200903048489666357

文書分類支援装置およびコンピュータプログラム

発明者:
出願人/特許権者:
代理人 (3件): 志賀 正武 ,  青山 正和 ,  村山 靖彦
公報種別:公開公報
出願番号(国際出願番号):特願2002-309555
公開番号(公開出願番号):特開2004-145626
出願日: 2002年10月24日
公開日(公表日): 2004年05月20日
要約:
【課題】参考書や取扱説明書のように節が進むに従って高度な内容が記述される文書データに対して、新規の分類対象文書を適切な節に分類するための分類先候補の提示を行う。【解決手段】文書分類支援装置の重要語抽出部102は、分類先文書DB101から分類先文書を読み出して重要語を抽出し、重要語DB103へ書き込む。重要語抽出部202は、分類対象文書記憶部201から読み出した分類対象文書から、重要語DB103内に登録されている重要語を抽出する。主題抽出部203は、抽出された重要語群からなる分類対象文書の主題を求める。分類先導出部204は、主題を構成する各重要語が分類先文書に最初に出現する節のうち、最も後ろの節を主題の分類先の節とする。表示部206は、分類対象文書の各主題を構成する重要語群と、各主題の分類先の節を画面に表示する。【選択図】 図1
請求項(抜粋):
階層化されたセクションにより構成される分類先文書と、前記分類先文書の下位階層のセクションへの分類を行う対象の分類対象文書と、重要語及び該重要語が前記分類先文書中に出現する下位階層のセクションの情報とを記憶する記憶部と、 前記記憶部から前記分類先文書を読み出し、重要語を抽出して該重要語が出現する下位階層のセクションの情報とともに前記記憶部に書き込む第1の重要語抽出部と、 前記記憶部から前記分類対象文書及び前記重要語を読み出し、前記分類対象文書から読み出した重要語を抽出する第2の重要語抽出部と、 前記第2の重要語抽出部が抽出した重要語と、前記記憶部内の該重要語が前記分類先文書中に出現する下位階層のセクションの情報とを基に、該重要語群からなる分類対象文書の主題を抽出する主題抽出部と、 前記主題抽出部が抽出した分類対象文書の主題を構成する重要語群と、前記記憶部内の該重要語が前記分類先文書中に出現する下位階層のセクションの情報とを基に、前記分類対象文書の主題の分類先の下位階層のセクションを導出する分類先導出部と、 前記主題抽出部が抽出した分類対象文書の主題を構成する重要語群と、前記分類先導出部が導出した分類対象文書の主題の分類先の下位階層のセクションとを表示する表示部と、 を具備することを特徴とする文書分類支援装置。
IPC (1件):
G06F17/30
FI (4件):
G06F17/30 210D ,  G06F17/30 170A ,  G06F17/30 210A ,  G06F17/30 414A
Fターム (5件):
5B075ND03 ,  5B075ND35 ,  5B075NR12 ,  5B075PQ75 ,  5B075UU06
引用特許:
出願人引用 (2件) 審査官引用 (2件)
引用文献:
前のページに戻る