Pat
J-GLOBAL ID:200903089907372886

クラスター分析装置およびクラスター分析方法

Inventor:
Applicant, Patent owner:
Agent (5): 吉武 賢次 ,  橘谷 英俊 ,  佐藤 泰和 ,  吉元 弘 ,  川崎 康
Gazette classification:公開公報
Application number (International application number):2003323362
Publication number (International publication number):2005092443
Application date: Sep. 16, 2003
Publication date: Apr. 07, 2005
Summary:
【課題】 概念検索により検索された文書を簡易かつ効率的に分類すること。【解決手段】 クラスター分析装置は、検索文の入力や検索結果の出力を行う利用者用端末装置1と、検索文に基づいて特許文献等の技術文献の検索処理を行う検索装置2と、検索装置2に特許文献等の技術文献の登録を行う管理用端末装置3とを備えている。概念検索により検索された技術文献に対して形態素解析を行って得られた各単語にウェイトを付加して、各技術文献をベクトル化し、ベクトルの向きが近い技術文献同士を一つのクラスターにまとめる処理を行うため、大量の技術文献をいくつかのクラスターに効率よく分類することができる。【選択図】 図1
Claim (excerpt):
検索対象となる複数の文書が格納された文書格納手段と、 入力された検索文を検索キーとして前記複数の文書を検索して、前記検索文と類似する文書を検索する概念検索手段と、 前記検索された文書に対して形態素解析を行って、前記検索された文書に含まれる複数の単語を抽出する形態素解析手段と、 抽出された前記複数の単語が前記検索された文書の中に現れる出現頻度に基づいて、前記複数の単語それぞれの重み付けを行う重み付け手段と、 前記重み付け手段による重み付け結果に基づいて、前記検索された文書に含まれる複数の単語の中から重みの大きい順に所定個の単語を抽出する次元引き下げ手段と、 前記次元引き下げ手段で抽出された単語の重みに基づいて、前記検索された文書を複数のクラスターに分類するクラスター分類手段と、 個々のクラスターごとに重要単語を抽出する重要単語抽出手段と、を備えることを特徴とするクラスター分析装置。
IPC (1):
G06F17/30
FI (4):
G06F17/30 210D ,  G06F17/30 170Z ,  G06F17/30 210A ,  G06F17/30 350C
F-Term (10):
5B075ND03 ,  5B075NK32 ,  5B075NR12 ,  5B075PQ02 ,  5B075PQ13 ,  5B075PR04 ,  5B075PR06 ,  5B075QM07 ,  5B075QP01 ,  5B075QS01
Patent cited by the Patent:
Cited by examiner (2)
Article cited by the Patent:
Cited by examiner (2)
  • 言語と計算5 情報検索と言語処理, 19991125, 第1版, pp.60-65
  • 言語と計算5 情報検索と言語処理, 19991125, 第1版, pp.60-65

Return to Previous Page