抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
言語研究において,新しい品詞体系を用いる場合には,既存の辞書やコーパス,解析器では対応できないことが多いため,これらを再構築する必要がある。これらのうち,辞書とコーパスは再利用できることが少なく,新たに構築する場合が多い。一方,解析器は既存のものを改良することで対応できることが多いものの,どのような改良が必要かは明らかになっていない。本論文では,品詞体系の異なるコーパスの解析に必要となる解析器の改良点を明らかにするためのケーススタディとして,品詞体系の異なる日本語話し言葉コーパス(以下,CSJ)と現代日本語書き言葉均衡コーパス(以下,BCCWJ)を利用して,長単位情報を自動付与した場合に生じる誤りを軽減する方策について述べる。具体的には,CSJを基に構築した長単位解析器をBCCWJへ適用するため,CSJとBCCWJの形態論情報における相違点に応じて,長単位解析器の学習に用いる素性やラベルを改善した。評価実験により提案手法の有効性を示す。(著者抄録)