特許
J-GLOBAL ID:200903064416948988

関連語抽出装置、関連語抽出方法及び関連語抽出プログラムが記録された記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 田澤 博昭 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-025406
公開番号(公開出願番号):特開2000-222427
出願日: 1999年02月02日
公開日(公表日): 2000年08月11日
要約:
【要約】【課題】 単語の共起関係の頻度のみから類似性を計算しているので、文書中に関連性を判定する対象の語が出現する回数が少ないと、類似度を測定するために充分な共起情報が取り出せず、類似度計算の信頼性が低下する課題があった。【解決手段】 単語の共起情報を参照して、共起関係にある単語間の類似度を測定するとともに、単語の言語的特徴を参照して、単語間の類似度を測定する一方、その双方の類似度を統合して、その単語間の類似度が基準レベルより高い場合、類似関係にある単語を関連語として提示する。
請求項(抜粋):
文書を構成する単語の共起情報を抽出する抽出手段と、上記抽出手段により抽出された共起情報を参照して、共起関係にある単語間の類似度を測定する第1の類似度測定手段と、単語の言語的特徴を参照して、単語間の類似度を測定する第2の類似度測定手段と、上記第1の類似度測定手段により測定された単語間の類似度と上記第2の類似度測定手段により測定された単語間の類似度を統合する統合手段と、上記統合手段により統合された単語間の類似度が基準レベルより高い場合、類似関係にある単語を関連語として提示する提示手段とを備えた関連語抽出装置。
FI (4件):
G06F 15/401 320 B ,  G06F 15/40 370 A ,  G06F 15/403 340 B ,  G06F 15/403 350 C
Fターム (10件):
5B075ND03 ,  5B075NK32 ,  5B075NK35 ,  5B075NS10 ,  5B075PQ36 ,  5B075PQ46 ,  5B075PR04 ,  5B075PR06 ,  5B075PR08 ,  5B075QM08

前のページに戻る