特許
J-GLOBAL ID:200903023520542405
単語出現度計算装置、文書検索装置、キーワード抽出装置、文書要約装置、文書分類装置、プログラム及び記憶媒体
発明者:
,
出願人/特許権者:
代理人 (3件):
柏木 慎史
, 小山 尚人
, 柏木 明
公報種別:公開公報
出願番号(国際出願番号):特願2002-250281
公開番号(公開出願番号):特開2004-086805
出願日: 2002年08月29日
公開日(公表日): 2004年03月18日
要約:
【課題】長い文書が入力された場合でも、文書検索に有用な重要語のみを選出できるようにして、文書検索の精度を向上する。【解決手段】検索要求の文書から不要語を除去した(ステップS2,S3)後の各単語が、検索対象文書である文書中の見出し、要約などの重要部位に出現する度合い(指定部位出現度)を計算する(ステップS4)。そして、指定部位出現度をもとに検索語を抽出し(ステップS5)、この検索語から適合文書を選出する(ステップS6)。【選択図】 図4
請求項(抜粋):
文字列の入力を受付ける入力手段と、
この受付けた文字列から単語を抽出する単語抽出手段と、
この抽出した各単語について所定の文書群の各文書における特定の部位での出現の度合いを計算する出現度計算手段と、
を備えている単語出現度計算装置。
IPC (1件):
FI (6件):
G06F17/30 350C
, G06F17/30 170A
, G06F17/30 210A
, G06F17/30 210D
, G06F17/30 220A
, G06F17/30 340B
Fターム (8件):
5B075ND03
, 5B075NK32
, 5B075NR12
, 5B075NS01
, 5B075PR04
, 5B075PR06
, 5B075QM08
, 5B075UU06
引用特許:
引用文献:
前のページに戻る