抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
日本語の意味を正しく取り扱うことを目的として拡張文節形態素解析システムでは,単語間の結合力が比較的強い連語を単語とみなして文節の概念を拡張している。日本語文を形態素解析システムchasenで解析した結果を拡張文節モデルで定義されている品詞体系に変換し,付属語,付属語性連語,副詞,連体詞,接続詞の辞書を用いて付属語性連語の意味を正しく抽出する。本論文では,自然言語処理においてMWE(Multi-Word Expression)への対処を可能にするために整理した自立語性連語を,拡張文節形態素解析システムに組み込む方法について述べた。確率的束縛性,語彙的一体性,熟語性のうち少なくとも1つを持つ名詞+格助詞「に」+動詞型表現を自立語性連語として約73000個収集しており,処理速度の低下を抑えるためにchasenの動詞辞書に追加する方法を検討した。実質的にchasenは連語に対応した形態素解析器となり,慣用句などをとらえられるようになることを示した。