特許
J-GLOBAL ID:201303071891111463
ドキュメントをテーマ別に分類する方法、ドキュメントをテーマ別に分類するコンピュータ、ドキュメントをテーマ別に分類するコンピュータの用法及び検索エンジンコンピュータ
発明者:
,
,
出願人/特許権者:
代理人 (5件):
石田 敬
, 鶴田 準一
, 下道 晶久
, 西山 雅也
, 樋口 外治
公報種別:特許公報
出願番号(国際出願番号):特願2001-525573
特許番号:特許第4718076号
出願日: 2000年09月22日
請求項(抜粋):
【請求項1】 ドキュメントをテーマ別に分類し、特に検索エンジンに対するテーマ別データベースを構築または更新することをコンピュータが実行する方法において、
該方法は、コンピュータが、
自動で各テーマを表すドキュメントのサンプルを選択する段階(10)と、
選択されたドキュメントにおいて、そのテーマに特有な単語を自動的に特定する段階(20)と、
特定された各単語に対し、対応するテーマに対する該単語の関連性を表す係数(R)を自動的に割当てる段階(26)と、
分類されるべき各ドキュメント(50)に対し、前記テーマの各々に対して前記ドキュメントに含まれる前記テーマ特徴付け単語を特定する段階(46)であって、コンピュータ・ネットワークからダウンロードされた各ドキュメントに対して自動的に実施される特定する段階(46)、および、前記ドキュメントが前記テーマに関連するか否かを判断する(56)ため特定された前記テーマ特徴付け単語に対応する各テーマに対し、特定された前記テーマ特徴付け単語に割当てられた前記係数を用いて前記ドキュメント(50)に対するそのテーマの関連性を表す特性の値を計算する段階であって、コンピュータ・ネットワークからダウンロードされた各ドキュメントに対して自動的に実施される計算する段階と、
ダウンロードされたドキュメントが取り扱うテーマの関数として前記特性の値を用いて該ドキュメントを自動的に分類する段階と、
検索要求に含まれるテーマに基づき照会され得るデータベース内で、テーマ別に分類された前記ドキュメントを自動的に記憶する段階と、を備え、且つ、
特定された各単語に対して前記係数を割当てる前記段階は、各テーマに対し、
前記コンピュータが、
前記テーマに関連がある選択ドキュメントにおける前記特定された各単語の頻度を定める第1頻度を自動的に計算する段階(26)と、
前記テーマに関連しない選択ドキュメントにおける前記特定された各単語の頻度を定める第2頻度を自動的に計算する段階(26)と、
前記第1頻度と前記第2頻度との比率を自動的に計算して、前記比率を前記係数に割り当てる段階(26)とを備え、且つ、
分類のためにドキュメントのテーマの関連性を表す前記特性を自動的に計算する前記段階(52)は、各テーマに対し、前記コンピュータが、
前記ドキュメントから抽出された各テーマ特徴付け単語に対する前記各頻度の前記比率(R)の値を読み取る段階と、
読み取られた各値を相互に乗算する段階と、
この乗算の結果を、前記特性の値に割当てる段階(54)と
を備える、
ことを特徴とするドキュメントをテーマ別に分類する方法。
IPC (1件):
FI (2件):
G06F 17/30 210 D
, G06F 17/30 170 A
引用特許:
出願人引用 (2件)
-
情報分類方法、装置及びシステム
公報種別:公開公報
出願番号:特願平9-334309
出願人:株式会社エヌ・ティ・ティ・データ
-
文書分類装置
公報種別:公開公報
出願番号:特願平5-259809
出願人:シャープ株式会社
審査官引用 (2件)
-
情報分類方法、装置及びシステム
公報種別:公開公報
出願番号:特願平9-334309
出願人:株式会社エヌ・ティ・ティ・データ
-
文書分類装置
公報種別:公開公報
出願番号:特願平5-259809
出願人:シャープ株式会社
前のページに戻る