文献
J-GLOBAL ID:201702270570542403   整理番号:17A0932345

カーネル法による構文に着目した作家の文体の特徴づけと類似性分析

Characterization and Similarity Analysis of Japanese Writers’ Syntactic Structures by Kernel Method
著者 (2件):
資料名:
巻: 32  号:ページ: F-G94_1-14(J-STAGE)  発行年: 2017年 
JST資料番号: U0128A  ISSN: 1346-8030  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
作品に基づく作家の分類では作品を構成する文の表層的統計量や,作品の意味内容を用いた議論がなされてきた。本論文では,それらの中間に位置付けられる文の構文構造に着目し,作家の文体の特徴や類似性を分析した。まず,文体比較にはより多く使われる言葉の違いや平均的な違いを調べる手法と,作品中の稀出語を取り上げる手法があり,非数値的構造データの類似度を測る木カーネルを用いると前者を分析できることを説明した。木カーネルは木に含まれるすべての部分木を対等に扱うので,稀出構文は浮かび上がらせることができないため,構文中の部分木の確率を考慮した木カーネル(情報量木カーネル)を導入した。代表的な日本作家31人の作品の係り受け構造に着目し,各文に対して還元的縮約を行った構文木からカーネル値を計算した。また,出現回数に基づく相対頻度を部分木の確率とし,還元的縮約を行った確率つき情報量木からカーネル値を計算したところ芥川龍之介,太宰治,夏目漱石,新美南吉,宮沢賢治の5作家で特徴的な係り受け木が見られた。そこで,部分木を素性とするdecision stumpsとそれを弱学習器とするBoostingテキスト分類アルゴリズムBactで作家の分類を行い,得られた結果を比較したところ木カーネルでは作家特有の木構造を抽出できることが確かめられた。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  自然語処理  ,  情報加工一般 
引用文献 (27件):
  • [青空文庫 15] 青空文庫: http://www.aozora.gr.jp/ (2015)
  • [Belkin 03] Belkin, M. and Niyogi, P.: Laplacian eigenmaps for dimensionality reduction and data representation. Neural Computation, 15, 1373-1396 (2003)
  • [陳 03] 陳 志文: 新聞の各紙面に見られる文体の類型:主成分分析法による朝日新聞と読売新聞の分析から, 国語学研究, 42, 54-44 (2003)
  • [Collins 01] Collins, M. and Duffy, N.: Convolution kernels for natural language, Advances in Neural Information Processing Systems, 625-632 (2001)
  • [Goncalvel 08] Goncalvel, T. and Quaresma, P.: Text classification using tree kernels and linguistic information. Proceedings of the 7th International Conference on Machine Learning and Applications }(ICMLA'08), 763-768 (2008)
もっと見る
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る