文献
J-GLOBAL ID:201702235731946317   整理番号:17A1293420

構造一致と特徴学習に基づくWebページラベル抽出【JST・京大機械翻訳】

Tags extraction for Web information based on structure con- sistency and feature learning
著者 (4件):
資料名:
巻: 53  号:ページ: 74-78,120  発行年: 2017年 
JST資料番号: C2533A  ISSN: 1002-8331  CODEN: JGYYAT  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 中国 (CHN)  言語: 中国語 (ZH)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
Webページ情報はページの本文、タイトル、発表時間、メディアなどの情報を指し、各情報はHTML文書の特定のラベルに存在し、これらのラベルを自動的に獲得することで、同じテンプレート下でのWebページ情報の自動抽出を実現でき、大規模なWebページの内容を把握するのに大きな役割を果たしている。同じテンプレートで異なるページ間の構造が一致しているので,Webページの情報は統計的特性を有するので,構造的比較と特徴的学習に基づくWebページ情報ラベルの自動抽出アルゴリズムを提案したが,それは,Webページの情報を抽出することができた。このアルゴリズムには3つのステップが含まれている。Webページの比較,コンテンツ認識,およびタグ抽出を含んでいる。51個のモジュールで1620個のWebページに対してテストを行い、実験結果により、タグを抽出することにより、Webページ情報を取得するだけでは、速度が速くなるだけでなく、把握の内容もより正確であることが分かった。Data from Wanfang. Translated by JST【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
著者キーワード (4件):
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
その他の情報処理  ,  人工知能 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る