文献
J-GLOBAL ID:202202246810720737   整理番号:22A1175934

NLP技術によるLDAアプローチによる英語とHindiニュース記事の文脈トピック同定のための提案モデル【JST・京大機械翻訳】

Proposed Model for Context Topic Identification of English and Hindi News Article Through LDA Approach with NLP Technique
著者 (2件):
資料名:
巻: 103  号:ページ: 591-597  発行年: 2022年 
JST資料番号: W4608A  ISSN: 2250-2106  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: ドイツ (DEU)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
調査によると,インドは世界の2番目に大きい新聞市場を持ち,100K以上の新聞出口,約240百万の循環,および1300万の加入者または読者である。トピックモデリング作業は日々増加し,研究者は複数のトピックモデリング論文を発表し,ソフトウェア工学,政治的科学,医学などの異なる分野でそれらを実装し,それはトピックモデリングと分類のためにうまく導入され,単語系列を考慮せずに語彙方式にテキスト依存の確率を測定するので,この検討では,LDAトピックモデリングが用いられている。LDAは,Gensim Pythonパッケージにおいて優れた実装を有する一般的なトピックモデリングアルゴリズムである。しかし,その課題は,単純,分離,意味がある良質な話題を抽出する方法である。本研究の目的は,2つの異なる言語(Hindiと英語)にある同じカテゴリーニュース記事の主なトピックスの発見と,次に類似性測定によるこれらの異なる言語ニューストピックの分類である。本研究では,コーパスをバイグラムで構築した。研究目標を達成するために,英語とHindi言語(Google News)の両方に対してGoogle Newsフィードからトップニュースをスクラップするヘッドラインとリンク抽出器をまず構築する必要があり,次に,2つのニュースヘッドラインが類似である分析を分析した。Copyright The Institution of Engineers (India) 2021 Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  パターン認識  ,  情報加工一般 

前のページに戻る