文献
J-GLOBAL ID:202102228978168013   整理番号:21A0005644

TOP-Rank:Urdu文書のためのキーフレーズ抽出を用いたトピック予測のための新しい教師なしアプローチ【JST・京大機械翻訳】

TOP-Rank: A Novel Unsupervised Approach for Topic Prediction Using Keyphrase Extraction for Urdu Documents
著者 (7件):
資料名:
巻:ページ: 212675-212686  発行年: 2020年 
JST資料番号: W2422A  ISSN: 2169-3536  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
自然言語処理(NLP)において,トピックモデリングは,大量のテキストを有する文書から抽象情報を抽出するための技術である。この抽象情報は,文書におけるトピックスの同定につながる。文書から話題を検索する一つの方法は,キーフレーズ抽出である。キーワードは文書の高レベル記述を表す用語の集合である。トピック予測のためのキーフレラーゼ抽出の種々の技法は,複数の言語,すなわち英語,アラビアなどに対して提案されているが,この領域は他の言語,例えばUrduに対して探索する必要がある。したがって,本論文では,文書からより重要な情報を抽出できるUrdu言語のためのトピック予測のための新しい教師なし手法を導入した。この目的のために,提案したTOP-Rankシステムは,文書からキーワードを抽出し,文章におけるそれらの位置に従ってそれらをランク付けする。ランキングスコアと共にこれらのキーワードを用いて,より意味のある話題を抽出するため構文規則を適用することによりキーフレーズを生成した。キーワードスコアに従ってこれらのキーフレーズをランク付けし,文書中の位置に関して再ランク付けした。最後に,提案モデルは,トップランクキーフレーズを局所有意性として同定し,最高のスコアを持つキーフレラーゼを文書のトピックとして選択した。実験を2つの異なるデータセットで行い,提案システムの性能を既存の最先端技術と比較した。結果は,提案システムが既存の技術より優れ,より意味のある話題を生成する能力を保持することを示した。Copyright 2021 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  パターン認識 

前のページに戻る