特許
J-GLOBAL ID:200903096822356756

単語重要度算出方法、装置、プログラム、および記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 金田 暢之 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2001-364323
公開番号(公開出願番号):特開2003-167891
出願日: 2001年11月29日
公開日(公表日): 2003年06月13日
要約:
【要約】【課題】 検索語の重要度を算出する。【解決手段】 まず、カテゴリ情報入力部101で、自動分類システムが自動分類するための前情報となるカテゴリとそれに割り当てられているサンプル文書を入力する。次に、検索サービスで記録された検索入力記録から「検索語」「選択したカテゴリ」の情報を、検索記録抽出部102で抽出する。検索記録集計部103では、検索語の入力回数を各カテゴリ毎に集計する。カテゴリ情報学習部104では、カテゴリ情報入力部101で獲得したデータから、文書内に存在する単語を抽出して各カテゴリ毎に集計し、検索記録集計部103で取得したデータも用いて、各カテゴリに対する単語の重要度を算出する。結果出力部105では、カテゴリ情報学習部104で求めた結果をディスプレイ等に出力する。
請求項(抜粋):
大量の文書情報をカテゴリに自動分類するために必要な、単語の重要度を算出する単語算出方法であって、分類先となるカテゴリと、該カテゴリにあらかじめ割り当てられたサンプル文書を入力する第1のステップと、検索入力記録から、検索語である単語と、選択されたカテゴリの情報を取得する第2のステップと、第2のステップで得た各カテゴリに対する各単語の入力回数を集計する第3のステップと、前記分類先となるカテゴリの単語が前記サンプル文書内に出現する回数を集計し、各カテゴリに対する単語の重要度を、該分類先カテゴリの総数と、当該単語が出現したカテゴリの数と、当該カテゴリに対する当該単語の出現回数と、当該単語の入力回数から算出する第4のステップと、カテゴリ、単語、該カテゴリに対する該単語の重要度を出力する第5のステップを有する単語重要度算出方法。
IPC (3件):
G06F 17/30 210 ,  G06F 17/30 170 ,  G06F 17/30 340
FI (3件):
G06F 17/30 210 D ,  G06F 17/30 170 A ,  G06F 17/30 340 B
Fターム (5件):
5B075ND03 ,  5B075NR12 ,  5B075PQ02 ,  5B075PQ38 ,  5B075PR04

前のページに戻る