文献
J-GLOBAL ID:201702265915146944   整理番号:17A0371516

キーフレーズ抽出のためのワイルドカードを用いた効率的な逐次パターンマイニング【Powered by NICT】

Efficient sequential pattern mining with wildcards for keyphrase extraction
著者 (5件):
資料名:
巻: 115  ページ: 27-39  発行年: 2017年 
JST資料番号: T0426A  ISSN: 0950-7051  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
文書におけるキーフレーズ(複数語ユニット)は基礎となる文書の主題を一つまたは複数のキーワードを示した。文書の良好なkeyphrasesの発見迅速に効率的な意思決定のための知識を要約し,集中的なテキスト情報を含むドメインを利益を得ることができる。今日まで,既存のキーフレーズ抽出法は,それぞれの特定の文書にカスタマイズできず,言い換えを形成しそれらのパターンは制限的であるすぎ,テキスト内の適応性のあるキーワード関係を捉えるない主な理由。本論文では,シーケンシャルパターンマイニングに基づく文書特異的キーフレーズ抽出法を提案した。重要な革新は逐次パターンを抽出に役立つワイルドカード(またはギャップ制約)を使用することであるので,パターン内の柔軟なワイルドカード制約は,単語間の意味的関係を捉えることができ,キーフレーズ抽出のための候補として異なるタイプの逐次パターンを発見するための完全な柔軟性を持つであろう。目標を達成するために,各単一文書を逐次データセットとして,採鉱プロセス中に捕捉したすべき重要なkeyphrasesを可能にするワイルドカードとワンオフ条件を用いた逐次パターンをマイニングするための効率的なアルゴリズムを提案した。各抽出したキーフレーズ候補に対し,それを特性化し,さらに訓練集合を形成する文書から全てkeyphrasesを収集するためにいくつかの統計的パターン特徴を用いた。教師つき学習分類器は,試験文書からkeyphrasesを同定するために訓練した。パターンマイニングとパターン特性化過程は各単一文書にカスタマイズされたので,この方法から抽出したkeyphasesは各文書のための高度に特異的である。実験結果は,提案した逐次パターンマイニング法は実行時間性能と完全性の両方で既存のパターンマイニング法より優れていることを実証した。キーフレーズベンチマークデータセットの比較も提案した文書特異的キーフレーズ抽出法は,抽出したkeyphrasesの品質を改善するのに有効であることを確認した。Copyright 2017 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る