文献
J-GLOBAL ID:201802225454134666   整理番号:18A0726938

ジャーナリズム関連性検出モデルを訓練するための半教師付きデータセットの構築【JST・京大機械翻訳】

Building a Semi-Supervised Dataset to Train Journalistic Relevance Detection Models
著者 (2件):
資料名:
巻: 2017  号: DASC/PiCom/DataCom/CyberSciTech  ページ: 1271-1277  発行年: 2017年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
注釈付きデータは教師つき学習タスクのための最も重要な要素の一つである。モデルの信頼性を確実にするために,このデータは,通常,ボランティアを通して,または,Crowd消費プラットフォームを使用することによって,いくつかの人間の注釈者によってラベル付けされる。しかし,そのようなアプローチは,膨大な数のエントリーを持つデータセットにおいて実行可能でない(時間とコストに関して),社会的メディアポストにおける旅行関連性検出の特定ケースにおいて,関連すると考えられる広範囲の話題により必要である。したがって,関連性検出モデルを構築する目的で,著者らは,Twitterポスト(すなわち,ツイート)の旅行的関連性に関する大規模注釈付けデータセットを構築するためのアーキテクチャを提案した。この方法論はTwitter会計における含有量の予測可能性に基づいている。次に,検索されたデータセットを用いて,テキスト,エンティティ,および感情特徴を組み合わせて,関連性検出モデルを構築した。最終的に,著者らは,FaceブックとTwitterからのポストを持つより小さい人手で注釈されたデータセットを通して,最良のモデルを検証した。検証データセットで達成されたF1測度は63%で,まだ優れていない。しかし,検証データの特性を考えると,これらの結果は,1)他のソーシャルネットワークからのコンテンツによって影響されない,2)検証データセットは特定の時間間隔と特定のキーワード(モデルの性能に影響を与える)に制約された。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  その他の情報処理 

前のページに戻る