特許
J-GLOBAL ID:200903067928846183
構造化文書抽出装置、構造化文書抽出方法および構造化文書抽出プログラム
発明者:
,
,
,
出願人/特許権者:
代理人 (1件):
酒井 宏明
公報種別:公開公報
出願番号(国際出願番号):特願2006-006443
公開番号(公開出願番号):特開2007-188330
出願日: 2006年01月13日
公開日(公表日): 2007年07月26日
要約:
【課題】様々な情報を利用することにより、より適切な文書を抽出することのできる構造化文書抽出装置を提供する。【解決手段】ネットワークを介してアクセス可能な構造化文書に本文として含まれる本文情報を特定する本文情報特定手段110と、構造化文書に付与されたデータであって、当該構造化文書の本文情報に関するデータおよび当該構造化文書と他の構造化文書との間のリンク関係を示すデータを含むメタデータを抽出するメタデータ抽出手段106と、ネットワークを介してアクセス可能な、複数の構造化文書から検索対象となる複数の対象文書を特定する対象文書特定手段104と、本文情報とメタデータとに基づいて、複数の前記対象文書それぞれの重要度を算出する重要度算出手段120とを備えた。【選択図】 図2
請求項(抜粋):
ネットワークを介してアクセス可能な構造化文書に本文として含まれる本文情報を特定する本文情報特定手段と、
前記構造化文書に付与されたデータであって、当該構造化文書の前記本文情報に関するデータおよび当該構造化文書と他の構造化文書との間のリンク関係を示すデータを含むメタデータを抽出するメタデータ抽出手段と、
前記ネットワークを介してアクセス可能な、複数の前記構造化文書から検索対象となる複数の対象文書を特定する対象文書特定手段と、
前記本文情報特定手段が特定した前記本文情報と、前記メタデータ抽出手段が抽出した前記メタデータとに基づいて、前記対象文書特定手段により特定された複数の前記対象文書それぞれの重要度を算出する重要度算出手段と
を備えたことを特徴とする構造化文書抽出装置。
IPC (1件):
FI (2件):
G06F17/30 140
, G06F17/30 419B
Fターム (4件):
5B075KK02
, 5B075ND03
, 5B075NK44
, 5B075PR08
引用特許:
引用文献:
審査官引用 (3件)
-
信用度に基づくblog情報フィルタリング
-
ニュース映像のシーン順序に基づく評価抽出とBlog検索
-
最大手ポータルのウェブログ・コンテンツ Yahoo!ブログ ベータ版
前のページに戻る