抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ShotgunWSDは,大域的単語センスあいまい化(WSD)のための最近の教師なしで知識ベースのアルゴリズムである。このアルゴリズムは,広く使用されている全ゲノム配列決定手法であるショットガン配列決定技術により触発されている。ShogunWSDは,3つの相に基づいて文書レベルでWSDを実行する。第一のフェーズは,各ウィンドウに対する可能性のあるセンス構成の短いリストを生成するために,文書から選択された短いコンテキストウィンドウに対するbrute 力WSDアルゴリズムを適用することからなる。第二相は,プレフィックスと接尾マッチングマッチングにより,局所センス構成をより長い複合構成に組み立てることから構成される。第3フェーズでは,結果としての構成をそれらの長さによりランク付けし,各単語の意味を,それぞれの単語が現れるトップ構成のみを考慮した多数投票方式に基づいて選択した。本論文において,著者らは,2つの単語感覚の間の関連性スコアを計算するための異なるアプローチに基づいているShogunWSDの改良版(2.0)を提示した。それは,より良い局所的感覚構成を構築するコアにとどまるステップである。それぞれの意味に対して,著者らは,対応するWordNet集合,光沢および関連する集合から,センスバッグへのすべての単語を収集した。著者らは,一般的な単語埋め込みフレームワークを用いて,全ドキュメントにおけるすべてのセンスバッグからベクトル空間に収集した単語を埋め込んだ。次に,単語ベクトルを,意味的に関連した単語のクラスタを形成するためにk-平均を用いてクラスタ化した。この段階では,より少ないサンプル(与えられた閾値に関して)を持つクラスタが異常値を表し,これらのクラスタを全体的に除去すると考える。除去されたクラスタからの単語もまた,各およびあらゆるセンスバッグから除去される。最終的に,著者らは,与えられたセンスバッグにおけるすべての残りの単語埋込みの中央値を計算して,対応する単語感覚のための意味埋込みを得る。著者らは,6つのベンチマークに関するいくつかの最先端の教師なしのWSDアルゴリズムと同様に,改良されたSthgunWSDアルゴリズム(バージョン2.0)を,6つのベンチマークに関して比較した。すなわち,2007年,Semeval-2,Senesval-3,SemEval2013,SemEval2015,および全体(統一)である。著者らは,ShotgunWSD2.0が,SthgunWSD1.0およびいくつかの他の最近の教師なしまたは知識ベースのアプローチよりも優れた性能をもたらすことを実証した。また,対McNemarの有意性試験を行い,ShotgunWSD 1.0上のShogunWSD 2.0の改善が,ほとんどの場合,統計学的に有意であり,信頼区間は0.01であることを示した。Copyright 2019 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】