特許
J-GLOBAL ID:200903039021929300

シソーラス作成方法

発明者:
出願人/特許権者:
代理人 (1件): 中村 稔 (外6名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-140954
公開番号(公開出願番号):特開平8-006971
出願日: 1995年06月08日
公開日(公表日): 1996年01月12日
要約:
【要約】【目的】 問い合わせに基づいて関連文書にアクセスする方法を提供する。【構成】 文書のコーパス内のワードについてワードベクトルのシソーラスを作る。ワードベクトルは大域語彙同時出現パターンとワード隣人間の関係を表す。ワードベクトルの組合せから作られた文書ベクトルはワードベクトルと同じ多次元空間内にある。単一値分解を使用して文書ベクトルの次元を縮小する。問い合わせ内のワードに対応付けられたワードベクトルの組合せから問い合わせベクトルを作る。問い合わせベクトルと文書ベクトルとを比較して関連文書を決定する。問い合わせベクトルを幾つかのファクタークラスタに分割してファクターベクトルを作ることができる。ファクターベクトルと文書ベクトルとを比較して、ファクタークラスタ内の文書のランキングを決定する。
請求項(抜粋):
文書のコーパスの文書内のワードの語彙同時出現に基づいてワードベクトルのシソーラスを作成する方法であって、コーパスからワードを検索し、前記ワードが所定の範囲内に前記ワードの前や後に位置するどれかの同時出現ワードと同時に出現する回数を記録し、前記所定の範囲内に位置するすべての同時出現ワードに対して前記記録ステップを繰り返し、すべての記録した回数に基づいて前記ワードに対するワードベクトルを生成することから成ることを特徴とするシソーラス作成方法。
FI (2件):
G06F 15/403 350 C ,  G06F 15/403 340 B

前のページに戻る