プレプリント
J-GLOBAL ID:202202218597735588   整理番号:22P0157148

ORCAS:探索解析のための18百万クリッククエリ-文書対【JST・京大機械翻訳】

ORCAS: 18 Million Clicked Query-Document Pairs for Analyzing Search
著者 (5件):
資料名:
発行年: 2020年06月09日  プレプリントサーバーでの情報更新日: 2020年08月18日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
Web検索エンジンのユーザは,質問とクリックを通してそれらの情報ニーズを明らかにし,クリックログを情報検索のための有用な資産にする。しかし,クリックログは,個人的または商業的に敏感な情報をあまり明らかにできないので,学術的使用のために公開されていない。本論文は,TREC深学習トラック文書コーパスに関連したクリックデータ放出について述べた。k-匿名性要件を含む凝集とフィルタリングの後,TREC DL URLの1.4百万が10百万の異なった質問に18百万の接続を持つことを見出した。これらの質問のデータセットとTREC文書への接続は,質問マイニングとランキングに関する以前の論文で使われる専用データセットと類似のサイズである。TREC DL訓練データを増強するためにクリックデータを用いていくつかの予備実験を行い,比較により,コーパスにおける4.4x以上のURLsに対する49xのより多くの接続を持つ28x以上の質問を提供した。データセット生成プロセス,特性,ランキングにおける利用の記述を示し,他の潜在的用途を示唆した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
検索技術  ,  人工知能 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る