特許
J-GLOBAL ID:201203079495744546
グループ化装置およびエレメント抽出装置
発明者:
,
,
,
,
,
,
出願人/特許権者:
,
,
代理人 (3件):
古谷 栄男
, 松下 正
, 鶴本 祥文
公報種別:公開公報
出願番号(国際出願番号):特願2011-031228
公開番号(公開出願番号):特開2012-168892
出願日: 2011年02月16日
公開日(公表日): 2012年09月06日
要約:
【課題】ネット上において特定ユーザーの個人領域ページを特定し、ページ内に含まれるエレメントを抽出する。【解決手段】第1のアドレスキーと第2のアドレスキーの類似度がしきい値以上と判断された場合に、URLを特定のアドレス群として関連付ける(個人領域の特定)。さらに、イメージ化したWebページ上に点を配置し、配置した点を含むエレメントの階層構造を統合などして、対応する内容データを抽出する(エレメントの抽出)。【選択図】 図1
請求項(抜粋):
Webページのアドレスをグループ化するためのグループ化プログラムであって、
コンピュータを、
特定のアドレスからWebページを取得するWebページ取得手段、
前記Webページからリンクを抽出し、抽出した各リンクのアドレスを区切り文字で分割して第1のアドレスキーを生成する第1のアドレスキー生成手段、
前記第1のアドレスキーを生成したリンクから取得されるWebページからリンクを抽出し、抽出した各リンクのアドレスを区切り文字で分割して第2のアドレスキーを生成する第2のアドレスキー生成手段、
前記第1のアドレスキーと前記第2のアドレスキーとの間で一致するキーを照合し、当該一致するキーの出現順序が同じである組み合わせ数を計数し、その結果に基づいて類似度を算出する類似度算出手段、
前記類似度がしきい値以上であると判断されたリンクのアドレスを、特定のアドレス群として関連付けるグループ化手段、
として機能させることを特徴とするグループ化プログラム。
IPC (1件):
FI (3件):
G06F17/30 210D
, G06F17/30 350C
, G06F17/30 419B
Fターム (7件):
5B075NK43
, 5B075NK44
, 5B075NR02
, 5B075NR20
, 5B075NS10
, 5B075QM08
, 5B075UU24
引用特許:
前のページに戻る