特許
J-GLOBAL ID:200903097272427380

分類キーワード生成方法および分類キーワード生成プログラムと該プログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 三好 秀和 (外3名)
公報種別:公開公報
出願番号(国際出願番号):特願2001-289989
公開番号(公開出願番号):特開2003-099445
出願日: 2001年09月21日
公開日(公表日): 2003年04月04日
要約:
【要約】【課題】 多数の文書情報の中から所望の情報を適確かつ効率的に取得し得るように各文書情報をカテゴリに分類するための分類キーワードを生成する分類キーワード生成方法を提供する。【解決手段】 カテゴリNの文書集合Sに含まれる単語集合Wの各単語に対して文書集合Sにおける出現文書数Dと全カテゴリの文書集合SFにおける出現文書数DFとに基づき各単語に対するカテゴリ適合度Vを算出し(ステップS9)、カテゴリ適合度Vに基づきカテゴリNの分類キーワードを選択し(ステップS11)、各分類キーワードの単語集合Wにおける出現頻度t/Tとカテゴリ適合度VとからカテゴリNにおける各分類キーワード重要度を算出し(ステップS13)、各分類キーワードを重み付けする(ステップS15)。
請求項(抜粋):
複数の文書をそれぞれ該当するカテゴリに分類するための分類キーワードを生成する分類キーワード生成方法であって、前記複数の文書が分類される複数のカテゴリを定義し、複数の文書の一部となる少数の文書を前記定義されたカテゴリにそれぞれ分類し、この少数の文書が分類された全カテゴリの各々について以下の処理を行うべく全カテゴリのうちの1つのカテゴリをカテゴリNとして特定し、このカテゴリNに分類された文書の集合を文書集合Sとして取り出し、この文書集合Sに含まれている単語を形態素解析により単語集合Wとして取り出し、この単語集合Wの各単語に対して前記文書集合Sにおける出現文書数Dおよび延べ出現回数tと全カテゴリの文書集合SFにおける出現文書数DFを算出するとともに、文書集合Sにおける全単語数Tを算出し、前記単語集合Wの各単語に対して前記文書集合Sにおける出現文書数Dと前記全カテゴリの文書集合SFにおける出現文書数DFとに基づき単語集合Wの各単語に対するカテゴリ適合度Vを算出し、前記カテゴリ適合度Vに基づき前記単語集合WからカテゴリNの分類キーワードとして適切な単語をカテゴリNの分類キーワードとして選択し、この分類キーワードの各々の文書集合Sにおける延べ出現回数tと文書集合Sにおける全単語数Tとから各分類キーワードの単語集合Wにおける出現頻度t/Tを算出し、前記分類キーワードの各々に対するカテゴリ適合度Vと前記出現頻度t/TとからカテゴリNにおける各分類キーワードの重み付け用の重要度を算出し、この分類キーワード重要度に基づき各分類キーワードを重み付けすることを特徴とする分類キーワード生成方法。
IPC (3件):
G06F 17/30 210 ,  G06F 17/30 170 ,  G06F 17/21 550
FI (3件):
G06F 17/30 210 D ,  G06F 17/30 170 A ,  G06F 17/21 550 A
Fターム (6件):
5B009QA12 ,  5B009SA14 ,  5B075ND03 ,  5B075NK02 ,  5B075NK32 ,  5B075NR12

前のページに戻る