Pat
J-GLOBAL ID:201203079495744546

グループ化装置およびエレメント抽出装置

Inventor:
Applicant, Patent owner:
Agent (3): 古谷 栄男 ,  松下 正 ,  鶴本 祥文
Gazette classification:公開公報
Application number (International application number):2011031228
Publication number (International publication number):2012168892
Application date: Feb. 16, 2011
Publication date: Sep. 06, 2012
Summary:
【課題】ネット上において特定ユーザーの個人領域ページを特定し、ページ内に含まれるエレメントを抽出する。【解決手段】第1のアドレスキーと第2のアドレスキーの類似度がしきい値以上と判断された場合に、URLを特定のアドレス群として関連付ける(個人領域の特定)。さらに、イメージ化したWebページ上に点を配置し、配置した点を含むエレメントの階層構造を統合などして、対応する内容データを抽出する(エレメントの抽出)。【選択図】 図1
Claim (excerpt):
Webページのアドレスをグループ化するためのグループ化プログラムであって、 コンピュータを、 特定のアドレスからWebページを取得するWebページ取得手段、 前記Webページからリンクを抽出し、抽出した各リンクのアドレスを区切り文字で分割して第1のアドレスキーを生成する第1のアドレスキー生成手段、 前記第1のアドレスキーを生成したリンクから取得されるWebページからリンクを抽出し、抽出した各リンクのアドレスを区切り文字で分割して第2のアドレスキーを生成する第2のアドレスキー生成手段、 前記第1のアドレスキーと前記第2のアドレスキーとの間で一致するキーを照合し、当該一致するキーの出現順序が同じである組み合わせ数を計数し、その結果に基づいて類似度を算出する類似度算出手段、 前記類似度がしきい値以上であると判断されたリンクのアドレスを、特定のアドレス群として関連付けるグループ化手段、 として機能させることを特徴とするグループ化プログラム。
IPC (1):
G06F 17/30
FI (3):
G06F17/30 210D ,  G06F17/30 350C ,  G06F17/30 419B
F-Term (7):
5B075NK43 ,  5B075NK44 ,  5B075NR02 ,  5B075NR20 ,  5B075NS10 ,  5B075QM08 ,  5B075UU24
Patent cited by the Patent:
Cited by examiner (5)
Show all

Return to Previous Page