特許
J-GLOBAL ID:200903029550942597

シソーラス作成装置

発明者:
出願人/特許権者:
代理人 (1件): 工藤 宣幸
公報種別:公開公報
出願番号(国際出願番号):特願平7-275264
公開番号(公開出願番号):特開平9-120401
出願日: 1995年10月24日
公開日(公表日): 1997年05月06日
要約:
【要約】【課題】 資料を入力してシソーラスを自動的に作成する。【解決手段】 形態素解析部は、文字列を読み込み、文字列を単語の列に解析し、それぞれの単語の品詞を特定したリストを作成し、共起抽出部に出力する。共起抽出部は、前記リストを解析して、共起データを抽出して共起蓄積部に出力する。共起蓄積部は、共起データと共起データ種類毎の出現頻度を記憶装置に記憶する。意味距離計算部は、共起蓄積部が記憶したデータから数量化手法により単語間の意味的な距離を計算し、計算結果をシソーラス生成部に出力する。シソーラス生成部は、意味距離計算部より受け取った意味的な距離を基にして単語をグループに分割し、さらにそれらのグループを順次グループに分割していく。全単語について操作が完了した後、シソーラス生成部は、単語をグループ化して階層化したものをシソーラスとして出力する。
請求項(抜粋):
入力文を解析して単語に分解するとともに単語の品詞を特定する形態素解析手段を備えて、単語をグループ化してシソーラスを作成するシソーラス作成装置において、上記形態素解析手段が解析した情報から共起データを抽出し、この共起データと共に共起データ種類毎の出現頻度を記憶する共起抽出記憶手段と、この共起抽出記憶手段に記憶された共起データと共起データ種類毎の出現頻度から、共起データを構成する第1の構成単語間、及び又は共起データを構成する第2の構成単語間の意味的な距離情報を算出する意味距離計算手段と、上記意味的な距離情報をもとに上記第1の構成単語、及び又は上記第2の構成単語をグループ化するシソーラス生成手段とを備えたことを特徴とするシソーラス作成装置。
IPC (2件):
G06F 17/28 ,  G06F 17/30
FI (2件):
G06F 15/38 C ,  G06F 15/403 350 C
引用特許:
審査官引用 (1件)

前のページに戻る