文献
J-GLOBAL ID:201802279301264202   整理番号:18A1005967

主題-Rヘム理論に基づくマイクロトピック方式による中国語談話トピックコーパスの構築【JST・京大機械翻訳】

Building a Chinese discourse topic corpus with a micro-topic scheme based on theme-rheme theory
著者 (4件):
資料名:
巻:号:ページ:発行年: 2017年 
JST資料番号: U7400A  ISSN: 2058-6345  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: イギリス (GBR)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
背景:適切なdis話トピック構造を構築することは,自然言語理解の中核であるdis話トピック分析における重要な問題である。自動コンピューティングを実行するためのキーとなる基本的なユニットであるだけでなく,大規模データ解析のプロセスの間,非構造化データから構造化データへの変換を実現するキーもある。dis話トピック構造には,dis話分析と関連作業における応用のための広い可能性があるが,そのようなdis話資源の構築に関する研究は,中国語において非常に制限されている。本論文において,著者らは,理論に従って中国語におけるdis話トピック構造を表現するためのマイクロトピックスキーム(MTS)を提案した。それは,ノードとしての基本的dis話トピックユニット(EDTU)とリンクとしてのtherheの参照を用いた。特に,主題の進行を用いて,dis話トピック構造の開発を直接表現した。【結果】MTSによってガイドされて,著者らは,500の文書の中国語のDis話トピックコーパス(CDTC)を手動で注釈した。さらに,著者らは,2つの同定予備実験において89.9と72.15のF1値を得て,それは提案した表現が良い自動計算を実行することができることを示した。【結論】中国語dis話トピック構造のための形式的表現システムと関連コーパス資源の欠如は,自然言語におけるdis話トピック分析の研究を大いに制限し,さらに自然言語理解の開発に影響を及ぼした。上記の問題を扱うために,機能的文法理論に基づいてマイクロトピックスキーム(MTS)表現を提案し,対応するコーパス資源(すなわちCDTC)を構築した。著者らの予備評価は,中国語dis話分析のためのMTSの妥当性とCDTCの有用性を正当化する。Copyright 2018 The Author(s). All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  情報加工一般 
引用文献 (29件):
  • Introduction to Text Linguistics; RA De Beaugrande, WU Dressler; Longman; 1981; CR1;
  • Building a discourse-tagged corpus in the framework of rhetorical structure theory; Current and New Directions in Discourse and Dialogue; L Carlson, D Marcu, ME Okurowski; Springer; 2003; CR2;
  • The penn discourse treebank 2.0; Proceedings of the 6th International Conference on Language Resources and Evaluation; R Prasad, N Dinesh, A Lee, E Miltsakaki, L Robaldo, AK Joshi, BL Webber; DBLP; 2008; CR3;
  • OntoNotes Release 4.0; R Weischedel, S Pradhan, L Ramshaw, J Kaufman, M Franchini, M El-Bachouti, N Xue, M Palmer, M Marcus, A Taylor, C Greenberg, E Hovy, R Belvin, A Houston; Linguistic Data Consortium; 2010; CR4;
  • On generalized-topic-based Chinese discourse structure; CIPS-SIGHAN Joint Conference on Chinese Language Processing; R Song, Y Jiang, J Wang; ACL Press; 2010; CR5;
もっと見る

前のページに戻る