文献
J-GLOBAL ID:201502219218932330   整理番号:15A0863909

HTML構造解析と機械学習に基づくイベント情報抽出システムの提案

著者 (5件):
資料名:
巻: 2015  号: UBI-46  ページ: VOL.2015-UBI-46,NO.13 (WEB ONLY)  発行年: 2015年05月04日 
JST資料番号: U0451A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本研究は,店舗のホームページやブログからクーポンやキャンペーンなどのイベント情報を抽出する方法を提案する。この方法を利用してユーザはをひとつひとつの店舗のホームページの閲覧を必要とせず,イベント情報抽出の網羅性と効率性を支援できる。本提案はWebページブロック分割およびイベント情報認識の二つのタスクから構成される。一つ目のタスクではWebページをタイトルや説明文や日付などのイベント情報を含むブロックに分割する。従来の研究は特定なタグ,画面構成あるいはブロックの機能などを特徴量としてWebページを分割することが多く,半構造化データのイベント情報抽出が難しかった。本研究ではHTML構造解析に基づいてWebページをブロックに分割する。二つ目のタスクとは分割されたブロックから不用な情報を取り除くため,イベント情報を識別する。本研究では機械学習の手法を用いてイベント情報の識別を実現する。名古屋駅地下街「エスカ」と「ユニモール」にある店舗96軒を対象として行った検証実験とその結果を示す。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
検索技術  ,  人工知能 
引用文献 (21件):
  • Chenyi L., Katsuhiko K., Kei H., Nobuo K.: Design and Implementation of Event Information Summarization System, CDS workshop of COMPSAC, 2014.
  • 廖宸一,梶克彦,廣井慧,河口信夫:時空間情報に基づくイベント情報の集約システムの開発,DICOMO,pp.646-656,2014.
  • Lin, S.-H., Ho, J.-M., Discovering Informative Content Blocks from Web Documents, In Proceedings of ACM SIGKDD'02, 2002.
  • Crivellari, F., Melucci, M., Web Document Retrieval Using Passage Retrieval, Connectivity Information, and Automatic Link Weighting-TREC-9 Report, In The Ninth Text REtrieval Conference (TREC 9), 2000.
  • Kovacevic, Milos, et al. Recognition of Common Areas in a Web Page Using Visual Information: a possible application in a page classification. In: Data Mining, 2002. ICDM 2003. Proceedings. 2002 IEEE International Conference on. IEEE. p. 250-257, 2002.
もっと見る

前のページに戻る