文献
J-GLOBAL ID:201002242000786078   整理番号:10A0242743

テキストコーパスから著者・主題モデルを学習する

Learning Author-Topic Models from Text Corpora
著者 (5件):
資料名:
巻: 28  号:ページ: 4:1-4:38  発行年: 2010年01月 
JST資料番号: H0971A  ISSN: 1046-8188  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
Webや特化したディジタルテキストコレクションが一般化し,テキストからの有用な情報の抽出が重要な研究課題となった。本論文は,大規模なテキストコレクションから,著者と主題に関する情報を抽出する教師なし学習技法を提案した。文書のモデル化は,まず著者を主題に関する確率分布により表現し,次に各主題は単語に関する確率分布として表現した。主題・単語と著者・主題の両分布は,Markov連鎖モンテカルロアルゴリズムを使用してデータから学習した。この方法論を,15万アブストラクト,1740論文,12万1千電子メールという,3種類の大規模テキストコーパスに適用して実験した。この実験で得た結果を,特定主題と著者モデル,著者の主題によるランキングおよびその逆,主題と著者によるアブストラクトの構文分析,などについて解釈した。提案した著者・主題モデルと既提案モデルとの違いも論じた。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  人工知能 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る