特許
J-GLOBAL ID:201503014250426597

グループ化装置およびエレメント抽出装置

発明者:
出願人/特許権者:
代理人 (2件): 古谷 栄男 ,  松下 正
公報種別:公開公報
出願番号(国際出願番号):特願2014-254357
公開番号(公開出願番号):特開2015-053087
出願日: 2014年12月16日
公開日(公表日): 2015年03月19日
要約:
【課題】ネット上において特定ユーザーの個人領域ページを特定し、ページ内に含まれるエレメントを抽出する。【解決手段】第1のアドレスキーと第2のアドレスキーの類似度がしきい値以上と判断された場合に、URLを特定のアドレス群として関連付ける(個人領域の特定)。さらに、イメージ化したWebページ上に点を配置し、配置した点を含むエレメントの階層構造を統合などして、対応する内容データを抽出する(エレメントの抽出)。【選択図】 図1
請求項(抜粋):
Webページのアドレスをグループ化するためのグループ化プログラムであって、 コンピュータを、 特定のアドレスからWebページを取得するWebページ取得手段、 前記Webページからリンクを抽出し、抽出した各リンクのアドレスを区切り文字で分割して第1のアドレスキーを生成する第1のアドレスキー生成手段、 前記第1のアドレスキーを生成したリンクから取得されるWebページからリンクを抽出し、抽出した各リンクのアドレスを区切り文字で分割して第2のアドレスキーを生成する第2のアドレスキー生成手段、 前記第1のアドレスキーと前記第2のアドレスキーとの間で一致するキーを照合し、当該一致するキーの出現順序が同じである組み合わせ数を計数し、その結果に基づいて類似度を算出する類似度算出手段、 前記類似度がしきい値以上であると判断されたリンクのアドレスを、特定のアドレス群として関連付けるグループ化手段、 として機能させることを特徴とするグループ化プログラム。
IPC (1件):
G06F 17/30
FI (3件):
G06F17/30 210D ,  G06F17/30 350C ,  G06F17/30 210A
引用特許:
審査官引用 (8件)
全件表示

前のページに戻る