抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
情報統合問題の鍵となる要素技術の一つとして情報源のラッピング技術がある.本稿では,HTMLで記述されたWebコンテンツをラッピングしてXMLデータに変換するソフトウェアであるHTMLラッパの構築支援手法を提案した.本手法のポイントは以下の通りである。(1)HTMLラッパ構築の問題を,XMLデータからのDTD生成の問題の一般化としてモデル化したこと。(2)DTD選択のための基準として,DTDの適切性とラッピングの具体性を組み合わせたことである.本稿では,筆者らが提案してきたラッピング言語Wraplet(HTMLで表現されたWebコンテンツから構造データを抽出するための言語),DTDの適切さを表すMDL(Minimum Description Length)コスト,ラッピングの具体性を表すSpecificity Value,および,HTMLラッパ生成支援手法について述べた。また,実際のWebページを用いて提案手法によるWraplet式で記述されたHTMLラッパの生成を行い,適切なWraplet式が選択できるかどうか検証するために行った予備実験について述べた。