特許
J-GLOBAL ID:201103075533650582

文書要約システム及び文書要約方法

発明者:
出願人/特許権者:
代理人 (1件): 松浦 兼行
公報種別:特許公報
出願番号(国際出願番号):特願2000-358808
公開番号(公開出願番号):特開2002-163276
特許番号:特許第4649731号
出願日: 2000年11月27日
公開日(公表日): 2002年06月07日
請求項(抜粋):
【請求項1】 HTML文書の集合を検索する際に、検索結果として表示する文書要約を作成する文書要約システムであって、 要約対象となるHTML文書の集合を予め記憶している文書集合記憶部と、 アンカー文字列の出現頻度による要約としての適切さの得点と、リンク元文書の文書タイプによる要約としての適切さの得点を予め記憶している得点情報記憶部と、 前記文書集合記憶部に記憶されている前記HTML文書毎に、前記HTML文書をリンク元文書としてそのリンク元文書からリンク先の文書のURLとアンカー文字列をそれぞれ抽出し、抽出した前記リンク先の文書のURL毎にリンク元文書のURLと抽出した前記アンカー文字列の対応を示す表に変換するアンカー文字列抽出手段と、 前記アンカー文字列抽出手段により抽出された前記アンカー文字列に対応する前記リンク元文書が、複数の異なる外部サイトへのリンクを持っているか、又は文書内にリンクという単語が存在し、かつ、外部サイトへのリンクが存在することを示すリンク集であるかどうかを前記文書集合記憶部のHTML文書の集合から判別する文書タイプ判別手段と、 前記アンカー文字列抽出手段により抽出されたアンカー文字列毎に、そのアンカー文字列の出現頻度と、前記文書タイプ判別手段により判別された判別結果に基づき、前記得点情報記憶部に記憶されている得点情報を参照して得点を付与し、合計得点の最も高いアンカー文字列を前記リンク先文書の要約として決定する要約文字列決定手段と を有することを特徴とする文書要約システム。
IPC (2件):
G06F 17/30 ( 200 6.01) ,  G06F 12/00 ( 200 6.01)
FI (6件):
G06F 17/30 220 A ,  G06F 17/30 170 A ,  G06F 17/30 340 B ,  G06F 17/30 419 B ,  G06F 12/00 546 B ,  G06F 12/00 547 H
引用特許:
審査官引用 (1件)
引用文献:
前のページに戻る