文献
J-GLOBAL ID:202002290703591884   整理番号:20A1868062

ブラウザレスWebデータ抽出の課題と機会【JST・京大機械翻訳】

Browserless Web Data Extraction Challenges and Opportunities
著者 (5件):
資料名:
号: WWW ’18  ページ: 1095-1104  発行年: 2018年 
JST資料番号: D0698C  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
最新のWebスクレーパーは,Webページをレンダリングし,ユーザ行動をシミュレートするための組込みブラウザを使用する。したがって,このようなスクレーパー(またはラッパー)は,時間とネットワークトラフィックに関して実行するために高価である。対照的に,HTTP要求を通してWebサーバを直接アクセスする「ブラウザレス」ラッパーを使用するのは,より資源効率が高く,生の回答から直接望ましいデータを取る。しかし,高精度のブラウザレスラッパーを創出し維持することは,専門家を必要とし,スケールにおいて禁止的に労働集約的である。本論文では,ブラウザベースのラッパーを「ブラウザレス」ラッパーに自動的に変換する主要な実現可能性を示した。適切に制限された型のWebサイトでそのような自動翻訳を行う最初のアルゴリズムとシステムを示した。このシステムは,テストケースの大部分で動作し,非常に高速で非常に資源効率の良いラッパーを生成する。このアプローチを,さらに多数の事例に適用できる一般的な方法に拡張するための研究課題を論じた。Please refer to this article’s citation page on the publisher website for specific rights information. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
計算機網 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る