抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
複雑な単語同定(CWI)は,テキストの単純化を含む様々なアプリケーションに対するテキストにおける複雑な単語の同定を含む教育NLPおよび応用言語学における基本的なタスクである。最近の研究は,いくつかの珍しいコーパスから単語周波数特徴が一般コーパスからのそれらと組み合わせて使用されるとき,それらがCWI精度を改善することを独立に報告した。これは,それらが一般的なコーパスのための調整として使用できることを示唆する。しかしながら,以前の研究では,コーパスの各ペア間の類似性値を分析しているが,コーパスの全体集合における類似性の重要性は不明である。これは,CWI精度を改善する目的で,一般的および珍しいコーパスの組合せの解析を複雑にする。したがって,企業の効果的なタイプの探索は徹底的である。より良い理解と非徹底的探索に貢献するために,本論文は新しいグラフベースの解析方法を提案した。最初に,教師なしの方法で様々なコーパスの単語頻度分布の間の様々な類似性を計算した。次に,各類似性を重み付きグラフと見なし,全体グラフ構造内の一対のコーパスまたはエッジの重要性を解析した。著者らの実験を通して,著者らの解析方法が,以前に報告されたコーパスの組合せが効果的である理由を説明することに成功したことを見出した。さらに,それは有効なコーパス組合せを見つけることができた。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】