プレプリント
J-GLOBAL ID:202202210126469070   整理番号:21P0070493

Fakeニュースデータ収集と分類:擬似関連性フィードバックによる不透明探索エンジンのための反復クエリー選択【JST・京大機械翻訳】

Fake News Data Collection and Classification: Iterative Query Selection for Opaque Search Engines with Pseudo Relevance Feedback
著者 (3件):
資料名:
発行年: 2020年12月23日  プレプリントサーバーでの情報更新日: 2021年02月21日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
オンライン検索エンジンからの情報検索は,多くのデータマイニングタスクにおける第一で最も重要なステップである。すべてのソーシャルメディアプラットフォームを含むWeb上で現在利用可能な検索エンジンの大部分は,短いキーワードクエリをサポートするブラックボックス(a.k.a不透明)である。これらの設定において,すべてのポストとコメントの検索は,特定のニュースアイテムを,自動的に,そして,大規模に議論することは,挑戦的なタスクである。本論文では,プロトタイプ文書を与えられた短いキーワードクエリを生成する方法を提案した。提案した反復クエリ選択アルゴリズム(IQS)は,クエリを反復的に改善するために,不透明検索エンジンと相互作用する。Twitter TREC Microblog 2012とTREC-COVID 2019データセットについて評価し,最先端技術と比較して優れた性能を示した。IQSを適用して,約70Kの真と偽のニュースアイテムの大規模ファクニュースデータセットを自動的に収集する。調査に利用可能なデータセットは,Twitter承認フォーマットにおいて22M以上の説明と61Mのツイートを含む。最先端の性能を達成するニュース検出タスクのためのデータセットの有用性を実証した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
検索技術 

前のページに戻る