複雑な単語同定のための様々なコーパスの単語頻度分布間の類似性のグラフベース解析【JST・京大機械翻訳】

Ehara Yo

文献

J-GLOBAL ID：202002275848070314 整理番号：20A0818385

複雑な単語同定のための様々なコーパスの単語頻度分布間の類似性のグラフベース解析【JST・京大機械翻訳】

Graph-Based Analysis of Similarities between Word Frequency Distributions of Various Corpora for Complex Word Identification

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=20A0818385&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=20A0818385&from=J-GLOBAL&jstjournalNo=W2441A") }}

著者 (1件)：
資料名：
巻： 2019 号： ICMLA ページ： 1982-1986 発行年： 2019年
JST資料番号： W2441A 資料種別：会議録 (C)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

複雑な単語同定(CWI)は,テキストの単純化を含む様々なアプリケーションに対するテキストにおける複雑な単語の同定を含む教育NLPおよび応用言語学における基本的なタスクである。最近の研究は,いくつかの珍しいコーパスから単語周波数特徴が一般コーパスからのそれらと組み合わせて使用されるとき,それらがCWI精度を改善することを独立に報告した。これは,それらが一般的なコーパスのための調整として使用できることを示唆する。しかしながら,以前の研究では,コーパスの各ペア間の類似性値を分析しているが,コーパスの全体集合における類似性の重要性は不明である。これは,CWI精度を改善する目的で,一般的および珍しいコーパスの組合せの解析を複雑にする。したがって,企業の効果的なタイプの探索は徹底的である。より良い理解と非徹底的探索に貢献するために,本論文は新しいグラフベースの解析方法を提案した。最初に,教師なしの方法で様々なコーパスの単語頻度分布の間の様々な類似性を計算した。次に,各類似性を重み付きグラフと見なし,全体グラフ構造内の一対のコーパスまたはエッジの重要性を解析した。著者らの実験を通して,著者らの解析方法が,以前に報告されたコーパスの組合せが効果的である理由を説明することに成功したことを見出した。さらに,それは有効なコーパス組合せを見つけることができた。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】

, , , , ,
, 【Automatic Indexing@JST】

図形・画像処理一般

, , , , , ,

前のページに戻る