文献
J-GLOBAL ID:201102225722240709   整理番号:11A1151753

構文・照応・評価情報つきブログコーパスの構築

Construction of a Blog Corpus with Syntactic, Anaphoric, and Sentiment Annotations
著者 (7件):
資料名:
巻: 18  号:ページ: 175-201  発行年: 2011年06月28日 
JST資料番号: L3934A  ISSN: 1340-7619  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近年,ブログを対象とした情報アクセス・情報分析技術が盛んに研究されている。我々は,この種の研究の基礎データの提供を目的とし,249記事,4,186文からなる,解析済みブログコーパスを構築した。主な特長は次の4点である。i)文境界のアノテーション。ii)京大コーパス互換の,形態素,係り受け,格・省略・照応,固有表現のアノテーション。iii)評価表現のアノテーション。iv)アノテーションを可視化したHTMLファイルの提供。記事は,大学生81名に「京都観光」「携帯電話」「スポーツ」「グルメ」のいずれかのテーマで執筆してもらうことで収集した。解析済みブログコーパスを構築する際,不明瞭な文境界,括弧表現,誤字,方言,顔文字等,多様な形態素への対応が課題になる。本稿では,本コーパスの全容とともに,いかに上記の課題に対応しつつコーパスを構築したかについて述べる。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
情報加工一般  ,  自然語処理  ,  その他の情報処理 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る