文献
J-GLOBAL ID:201802267059941630   整理番号:18A0445435

潜在的ディリクレ配分法とオントロジーに基づいたニュース文書収集に向けたトピック標識【Powered by NICT】

Topic labeling towards news document collection based on Latent Dirichlet Allocation and ontology
著者 (3件):
資料名:
巻: 2017  号: ICICoS  ページ: 247-252  発行年: 2017年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
潜在的ディリクレ配分(LDA)は,組織化,理解,探索,テキストと情報検索に実装された,ことが証明されている電子アーカイブを要約する柔軟性をもつことをトピックモデリング方法である。LDA法の弱点は,形成されていることが話題を標識することができないことである。本研究では,オントロジー方式を用いたLDAを組み合わせたLDAに標識話題の弱点を克服した。本研究では,オンラインニュース門脈から採取した50のニュース文書のデータセットを用いた。本研究で使用したオントロジー方式は「Kamus Besarインドネシア語(KBBI)」に含まれる場の辞書に基づいている。実験は,トピックに関連するラベル名を生産するために各主題からの最ゆう単語列数表現を見出すことを目的とした。Cohenのカッパ係数は二言語専門家の一致に基づいてラベルの信頼性を測定するために使用されているが,平均関連性速度を用いて,κ値の41%以上を持っている特別な単語表現を用いたラベルに対する言語学的専門家の関連値の平均を測定した。本研究の結果は,最高のκ値は100%値と各話題の表現を五語のであることを示しているが,最も高い平均関連性率は80%値と各話題の5と30語表現である。カッパ値の平均は61%であり,平均関連速度の平均値は71%であった。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (4件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  情報加工一般  ,  分子・遺伝情報処理  ,  システム・制御理論一般 

前のページに戻る