抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
自然言語処理技術は各問題に関連するメタ情報がアノテーションされたコーパスの整備とともに発展したが,意味や談話の粒度で問題を考える場合の難しさを問題設定で回避する傾向にある。本論文では,1)述語項構文解析,2)照応・共参照解析,3)談話関係解析での問題設計の利点・欠点を考察した。1)では,i)PropBank,ii)NomBank,iii)京都大学テキストコーパス4.0,iv)NAISTテキストコーパスが利用されており,英語を対象とするi),ii)では抽象度高い意味関係を用いているが意味役割は扱えず,日本語を対象とするiii),iv)では表層格をもとに次にすべきアノテーションを考える必要がある。2)では表現が固有名である場合に限定して共参照解析問題を定義しているAutomatic Content Extraction programの共参照関係タグ付きコーパスを取り上げ,一般的な代名詞の照応関係問題を解くには不十分なことを示した。3)では談話構造を木構造とする修辞構造理論(RST)で定義された談話関係,RSTからの派生としてのDGB(Discourse Graphbank),PDTB(Penn Discourse Treebank)の問題点を考察した。さらに,アノテーション作業及び仕様作成の経験を踏まえ,作業者の技能による影響や前記技能の見積もりに関する重要性を論じた。