抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
複雑な単語同定(CWI)は,テキストの単純化を含む多くの更なるアプリケーションに使用するためにテキスト中の複雑な単語を同定する基本的な教育的自然言語処理(NLP)タスクである。一般コーパスからの単語周波数特徴は,複雑な単語の同定に有効であることが知られている。最近の研究では,一般コーパスからの単語頻度特徴と組み合わせて用いると,いくつかのタイプの非一般コーパス,すなわち映画サブタイトルコーパス(Peatzoldとspecia,2016)と学習者コーパス(KajiwaraとKomachi,2018)からの単語頻度特徴がCWI精度を改善した。一般的および非一般的な企業のこの組合せが改善された精度が明らかになっていない理由と同様に,有効なコーパスの組合せと他のタイプの効果的なコーパスの探索は徹底的である。非徹底的探索に寄与するために,本研究では,教師なしの方法で行うことができる様々なコーパスの単語頻度分布間の類似性を解析した。CWI共有タスクデータセットを用いた実験において,著者らの方法は,以前に報告されたコーパスの組み合わせが効果的である理由を説明することに成功し,一方,有効なコーパスを発見することに成功した。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】