特許
J-GLOBAL ID:200903071456558305

データ分類装置/方法、データ分類木生成装置/方法、派生語抽出装置/方法、シソーラス構築装置/方法、データ処理システム

発明者:
出願人/特許権者:
代理人 (1件): 大菅 義之 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-022697
公開番号(公開出願番号):特開平8-016620
出願日: 1995年02月10日
公開日(公表日): 1996年01月19日
要約:
【要約】【目的】 適切なキーワード又は派生語を自動的に抽出可能とし、また、辞書を必要とすることなく、キーワード又は派生語の抽出結果に基づいて文字データを分類することにより適切なシソーラスを構築可能とすることを目的とする。【構成】 手段1は、文字データの事例の集合から、派生語代表文字列候補を生成する。手段2は、派生語代表文字列候補に関する分類属性の評価を文字データの事例に対して行うことで、派生語代表文字列を1つの内部ノードにラベル付けする。また、手段2は、選択された派生語代表文字列に関する分類属性の評価を文字データの事例に対して行うことで、各文字データの事例を順次分類し、データ分類木3を生成する。手段4は、データ分類木3を用いて新たな文字データを分類する。手段5は、所望の文字データのデータ分類木3上でのパス上に存在する各内部ノードにラベル付けられた派生語代表文字列又はその派生語代表文字列の否定語の連語として、所望の文字データのシソーラスを自動的に構築する。
請求項(抜粋):
内部ノードに派生語代表文字列がラベル付けされた二進木であるデータ分類木を記憶するデータ分類木記憶手段と、前記データ分類木上の1つの内部ノードである根ノードを起点として、前記データ分類木上の各内部ノードにおいて、入力された文字データが該内部ノードにラベル付けされている派生語代表文字列又はその派生語を部分文字列として含むか否かという分類属性の評価を行いながら該評価結果に基づいて分岐動作を実行し、最終的に到達した前記データ分類木上の葉ノードにラベル付けされている分類クラスに前記入力された文字データを分類するデータ分類手段と、を有することを特徴とするデータ分類装置。
FI (2件):
G06F 15/401 310 D ,  G06F 15/403 350 C

前のページに戻る