Pat
J-GLOBAL ID:200903088765712459
関連キーワード自動抽出装置、文書検索装置及びこれらを用いた文書検索システム
Inventor:
,
,
,
,
,
Applicant, Patent owner:
Agent (1):
蔵合 正博
Gazette classification:公開公報
Application number (International application number):1997176822
Publication number (International publication number):1999025108
Application date: Jul. 02, 1997
Publication date: Jan. 29, 1999
Summary:
【要約】【課題】 実際の検索対象文書の特性に即し、かつそのキーワードによる検索を実行した場合少なくとも1件以上の検索結果が得られるような関連キーワードを自動抽出すること。【解決手段】 関連キーワード自動抽出装置として、各文書の属性情報や入力検索式などに基づいて文書の部分集合を特定する文書集合選定部19と、各単語の対象文書11全体における統計情報14および文書毎に出現する単語とその統計情報15を管理する単語統計情報管理部17と、単語統計情報14、15を基に、或る文書の部分集合に出現する各単語の重要度を算出して重要度の順に整列する単語ランキング部18とを設け、単語統計情報管理部により、文書全体、および特定された文書部分集合における各単語の統計情報を高速に求める。これにより、或る文書集合に出現する単語を、その重要度に基づいてランキングし、その一部を関連キーワードとして提示することができる。
Claim (excerpt):
辞書を用いて対象文書集合の各文書に出現する単語または単語の組の出現頻度や分布などの統計情報があらかじめ抽出されている文書集合に対して、各文書に付与された属性情報やユーザが入力した検索式などに基づいて文書の部分集合を特定する文書集合選定部と、各単語の対象文書全体における統計情報、および各文書ごとの当該文書に出現する単語とその統計情報を管理する単語統計情報管理部と、各単語の全文書および各文書ごとの統計情報を基に、特定された部分集合に出現する各単語の重要度を算出して重要度の順に整列する単語ランキング部とを有し、整列された単語群のうちの特定部分のみについて、単語もしくは単語とその重要度の組を抽出し、これを再利用可能な形で提示するようにしたことを特徴とする関連キーワード自動抽出装置。
FI (2):
G06F 15/401 310 A
, G06F 15/40 370 A
Patent cited by the Patent:
Cited by examiner (7)
-
文書検索装置
Gazette classification:公開公報
Application number:特願平3-241736
Applicant:日本電信電話株式会社
-
形態素解析装置及びキーワード抽出装置
Gazette classification:公開公報
Application number:特願平5-086154
Applicant:松下電器産業株式会社
-
文書検索装置
Gazette classification:公開公報
Application number:特願平3-326557
Applicant:株式会社リコー
-
文書テキスト間の連鎖自動作成システム
Gazette classification:公開公報
Application number:特願平3-195033
Applicant:東京電力株式会社
-
文書処理装置
Gazette classification:公開公報
Application number:特願平5-330249
Applicant:キヤノン株式会社
-
キーワード抽出装置
Gazette classification:公開公報
Application number:特願平7-046565
Applicant:キヤノン株式会社
-
文書登録装置及び文書検索装置
Gazette classification:公開公報
Application number:特願平7-096106
Applicant:富士ゼロックス株式会社
Show all
Return to Previous Page