特許
J-GLOBAL ID:200903000777142440
関連語辞書作成装置
発明者:
,
,
,
,
,
,
出願人/特許権者:
代理人 (1件):
岩上 昇一 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平6-321208
公開番号(公開出願番号):特開平8-161343
出願日: 1994年12月01日
公開日(公表日): 1996年06月21日
要約:
【要約】【目的】検索対象文書から関連語を漏れなく、かつ迅速に抽出し、関連語辞書に登録する。【構成】共起ファイル手段は、キーワード抽出手段により抽出したキーワード群から共起の関係にあるキーワード対を求める。共起の関係は抽出の出所である文書単位が同一であるか否かによって決める。そして、共起の関係にあるキーワード対のそれぞれに対して、文書に現れた頻度を記録する。関連語辞書登録手段は、作成された共起ファイルを参照して、関連語辞書を作成する。その際、共起ファイルのキーワード対の出現頻度は、キーワード対のキーワード同士の関連の強さを表しているので、この出現頻度が適宜に設定した閾値よりも大きいときに、これらは関連語であるとみなし、その一方を見出し語とし、他方をその関連語として関連語辞書に登録する。
請求項(抜粋):
検索対象とする文書のキーワードを抽出するキーワード抽出手段と、抽出したキーワード群から、同一の文書単位を抽出の出所とするキーワード群を共起の関係にあるキーワードとし、その共起の関係にあるキーワード群からキーワードの対をすべて求めるとともに、そのれらの各キーワード対の出現頻度を求め、共起ファイルに保持する共起ファイル手段と、前記共起ファイル手段を参照し、前記出現頻度が設定された閾値を越えたキーワード対を、その一方を見出し語とし、他方をその関連語として、関連語辞書に登録する関連語辞書登録手段とを備えた関連語辞書作成装置。
引用特許:
前のページに戻る