Pat
J-GLOBAL ID:200903096822356756

単語重要度算出方法、装置、プログラム、および記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 金田 暢之 (外1名)
Gazette classification:公開公報
Application number (International application number):2001364323
Publication number (International publication number):2003167891
Application date: Nov. 29, 2001
Publication date: Jun. 13, 2003
Summary:
【要約】【課題】 検索語の重要度を算出する。【解決手段】 まず、カテゴリ情報入力部101で、自動分類システムが自動分類するための前情報となるカテゴリとそれに割り当てられているサンプル文書を入力する。次に、検索サービスで記録された検索入力記録から「検索語」「選択したカテゴリ」の情報を、検索記録抽出部102で抽出する。検索記録集計部103では、検索語の入力回数を各カテゴリ毎に集計する。カテゴリ情報学習部104では、カテゴリ情報入力部101で獲得したデータから、文書内に存在する単語を抽出して各カテゴリ毎に集計し、検索記録集計部103で取得したデータも用いて、各カテゴリに対する単語の重要度を算出する。結果出力部105では、カテゴリ情報学習部104で求めた結果をディスプレイ等に出力する。
Claim (excerpt):
大量の文書情報をカテゴリに自動分類するために必要な、単語の重要度を算出する単語算出方法であって、分類先となるカテゴリと、該カテゴリにあらかじめ割り当てられたサンプル文書を入力する第1のステップと、検索入力記録から、検索語である単語と、選択されたカテゴリの情報を取得する第2のステップと、第2のステップで得た各カテゴリに対する各単語の入力回数を集計する第3のステップと、前記分類先となるカテゴリの単語が前記サンプル文書内に出現する回数を集計し、各カテゴリに対する単語の重要度を、該分類先カテゴリの総数と、当該単語が出現したカテゴリの数と、当該カテゴリに対する当該単語の出現回数と、当該単語の入力回数から算出する第4のステップと、カテゴリ、単語、該カテゴリに対する該単語の重要度を出力する第5のステップを有する単語重要度算出方法。
IPC (3):
G06F 17/30 210 ,  G06F 17/30 170 ,  G06F 17/30 340
FI (3):
G06F 17/30 210 D ,  G06F 17/30 170 A ,  G06F 17/30 340 B
F-Term (5):
5B075ND03 ,  5B075NR12 ,  5B075PQ02 ,  5B075PQ38 ,  5B075PR04

Return to Previous Page