文献
J-GLOBAL ID:201702237137499700   整理番号:17A0981320

テキストマイニングを用いた筆者識別へのスコアリング導入 文字数やテキスト数,文体的特徴が得点分布に及ぼす影響

Introduction of scoring for author identification by text mining: Effects of the number of characters and texts, and the features of writing style
著者 (2件):
資料名:
巻: 22  号:ページ: 91-108(J-STAGE)  発行年: 2017年 
JST資料番号: L4119A  ISSN: 1880-1323  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
文章を文字,単語,フレーズなどの単位に分解,数量化し,コンピューターを使用してデータを統計解析するテキストマイニングと呼ばれる手法が筆者識別に用いられている。本研究で扱った文体的特徴は,1)非自立語の使用率,2)品詞のbigram,3)助詞のbigram,4)読点の打ち方,5)漢字,仮名などの使用率,および,6)文章の長さである。データ解析には,1)主成分分析,2)対応分析,および,3)多次元尺度法を用いた。筆者識別の判定標準化のために,分析結果に対するスコアリングルールを設定し,その妥当性について検証した。文字数,テキスト数,文体的特徴の得点分布への影響や,複数の多変量データ解析を実施することの増分妥当性についても検討した。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
数値計算  ,  その他の計算機利用技術 
引用文献 (39件):
もっと見る

前のページに戻る