特許
J-GLOBAL ID:200903042583589112
コンテンツ提供方法
発明者:
,
,
,
出願人/特許権者:
代理人 (1件):
井上 学
公報種別:公開公報
出願番号(国際出願番号):特願2006-250240
公開番号(公開出願番号):特開2008-071212
出願日: 2006年09月15日
公開日(公表日): 2008年03月27日
要約:
【課題】 Webコンテンツにおいて、ソース中にコンテンツの構成を表す論理構造情報を持たない場合でも、レイアウト情報を用いることで、コンテンツの構成を認識し、ユーザへコンテンツの構成情報を提供する。【解決手段】 Webコンテンツに含まれるテキストや入力領域などのパーツのレイアウト情報を用いることで、パーツ間をグルーピングし、このグループ化されたパーツをノードに格納したコンテンツの構成を表すコンテンツ構成ツリー情報を生成する。このコンテンツ構成ツリー情報を用いて、クライアントの出力環境に応じた出力ファイルを生成する。【選択図】 図1
請求項(抜粋):
コンテンツ解析装置によるコンテンツ解析方法であって、
パーツ情報取得部は、コンテンツファイルを解析し、該コンテンツファイルのテキスト情報をその位置情報と対応付けたテキストリスト情報を格納し、入力領域情報をその位置情報と対応付けた入力領域リスト情報を格納し、
グルーピング部は、前記入力領域リスト情報から、それぞれの前記入力領域情報の間の位置関係が所定の条件を満たす場合に、前記条件を満たす前記入力領域情報をグループとして抽出し、
ツリー情報生成部は、前記抽出したグループに基づき、前記入力領域情報をノードに格納したツリー構造のコンテンツ構成ツリー情報を生成し、
ラベル付与部は、前記コンテンツ構成ツリー情報の各ノードの前記入力領域情報に対応するテキスト情報を前記テキストリスト情報から取得し、前記各ノードのラベルとして前記コンテンツ構成ツリー情報に格納し、
ソース生成部は、前記コンテンツ構成ツリー情報から出力ファイルを生成する
ことを特徴とするコンテンツ解析方法。
IPC (3件):
G06F 13/00
, G06F 12/00
, G06F 17/30
FI (4件):
G06F13/00 550L
, G06F12/00 546R
, G06F17/30 210D
, G06F17/30 419A
Fターム (4件):
5B075ND35
, 5B075NR12
, 5B082GA02
, 5B082HA07
引用特許:
前のページに戻る