特許
J-GLOBAL ID:200903085011835440

カテゴリ別新出特徴語ランキング方法及び装置及びプログラム及びカテゴリ別新出特徴語ランキングプログラムを記録したコンピュータ読み取り可能な記憶媒体

発明者:
出願人/特許権者:
代理人 (1件): 伊東 忠彦
公報種別:公開公報
出願番号(国際出願番号):特願2003-372996
公開番号(公開出願番号):特開2005-135311
出願日: 2003年10月31日
公開日(公表日): 2005年05月26日
要約:
【課題】 複数のカテゴリ別に収集された多数の文書からカテゴリ毎の新着特徴語を容易に抽出し、現在のトレンドを支援する。【解決手段】 本発明は、複数のカテゴリに分類された作成時刻情報付きの文書がデータベースより入力されると、該文書を解析し、該文書内に出現する語句と該語句に関する語句付随情報を集計し、語句の前記語句付随情報を利用し、該語句が出現するカテゴリへの関連度を、各語句について算出する。【選択図】 図1
請求項(抜粋):
カテゴリ別に新出の特徴語をランキングするためのカテゴリ別新出特徴語ランキング方法において、 語句集計手段が、複数のカテゴリに分類された作成時刻情報付きの文書がデータベースより入力されると、該文書を解析し、該文書内に出現する語句と該語句に関する語句付随情報を集計する語句集計ステップと、 カテゴリ関連度評価手段が、語句の前記語句付随情報を利用し、該語句が出現するカテゴリへの関連度を、各語句について算出するカテゴリ関連度評価ステップと、からなり、 前記語句集計ステップは、 前記語句付随情報として前記語句の出現カテゴリ数、ならびに、該語句の文書内出現回数に、作成時刻がより新しい文書ほど大きな重みを掛けながらカテゴリ内の全文書について加算して得られたカテゴリ別時間傾斜出現量とを記憶手段に記録し、 前記カテゴリ関連度評価ステップは、 語句の前記出現カテゴリ数に基づいて決定される出現カテゴリ数要素と、前記カテゴリ別時間傾斜出現量に基づいて決定される出現量要素と、から構成されるカテゴリ関連度を算出することで、語句のカテゴリ別ランキングを作成する、ことを特徴とするカテゴリ別新出特徴語ランキング方法。
IPC (1件):
G06F17/30
FI (2件):
G06F17/30 220Z ,  G06F17/30 170A
Fターム (7件):
5B075ND03 ,  5B075NK32 ,  5B075NR12 ,  5B075PR06 ,  5B075QM08 ,  5B075QP01 ,  5B075UU06
引用特許:
出願人引用 (2件) 審査官引用 (4件)
全件表示

前のページに戻る