文献
J-GLOBAL ID:201702211797370322   整理番号:17A1384140

著者プロファイリングにおける距離測度【Powered by NICT】

Distance measures in author profiling
著者 (2件):
資料名:
巻: 53  号:ページ: 1103-1119  発行年: 2017年 
JST資料番号: E0362B  ISSN: 0306-4573  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: イギリス (GBR)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
文書(例えば,性別,年齢)の著者についてのいくつかの人口統計を決定する過去10年間に多くの研究を集めている。著者プロファイリング作業を解決するために,様々な分類モデルは,様式的な特徴(例えば,機能単語頻度,文字や単語のn-gram,POS分布),並びに種々の語いの豊富さまたは全体的スタイル測定に基づいて提案した。標的カテゴリーを決定するために,異なる距離測度は他の全てを明白に支配する一つの方法なしに示唆されている。本論文では,研究,関数の五つの一般的な家族から抽出した24距離測度。さらに,六つの理論的特性を提示し,著者らはTanimotoまたはMatusita距離測度は,提案したすべての特性を尊重ことを示した。この解析を補完するために,最後のCLEF評価キャンペーンから抽出した13種のテストコレクションは,これらの距離測度の有効性を経験的に評価するために採用した。試験セットは性別二および四~五の年齢群の間で四言語(英語,スペイン,オランダ,イタリア),四テキストジャンル(ブログ,ツイッター,レビュー,およびソーシャルメディア)をカバーしている。経験的評価は,キャンベラまたはClark距離測度は,少なくとも著者プロファイリング作業の状況におけるよりも良好な有効性を生成する傾向があることを示した。また筆者らの実験は,試験セット(例えば,同じ収集)と密接に関連しているトレーニングセットを有する全体的な性能に明確な影響を持つことを示した。同じ収集(脱離one out法)を用いた場合と比較して訓練中に同じテキストジャンルを用いた場合性別正診率は7%(19%)減少した。異なるテキストジャンルを用いた訓練と試験段階の全体的な性能を損なう,年齢性別分類のための約11%の最終的精度率26%への減少を示す傾向がある。Copyright 2017 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  人工知能 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る