文献
J-GLOBAL ID:201602204362284068   整理番号:16A0034759

スタックオーバーフローにおける多因子重複問題検出【Powered by NICT】

Multi-Factor Duplicate Question Detection in Stack Overflow
著者 (4件):
資料名:
巻: 30  号:ページ: 981-997  発行年: 2015年 
JST資料番号: W0182A  ISSN: 1000-9000  CODEN: JCTEEM  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 中国 (CHN)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
スタックオーバーフローは,一般的なオンライン問題であり,それらの経験と専門知識を共有するためのソフトウェア開発者のための部位に答えた。スタックオーバーフローに投稿された多くの疑問の中で,それらの二以上が同一点を発現する可能性があり,したがって互いに重複。重複問題がスタックオーバーフローサイト保守をより硬く,他の疑問に答える,不必要には既に利用可能な回答を待つ開発者を生じさせるために使用された廃棄物資源。重複問題の問題を低減するために,スタックオーバーフローは他の重複として標識手動で質問を可能にした。毎日スタックオーバーフローに提出された問題の千年以来,重複問題を同定する手動で困難な作業である。このように,これらの重複質問の検出を支援することのできる自動化手法が必要である。上述必要性を解決するために,本論文では,入力として新しい問題を複数の因子を考慮してこの問題の潜在的複製を検出するDUPPREDICTORと命名した自動化手法を提案した。DUPPREDICTORは質問のタイトルと記述とも問題に付着していることをタグを抽出した。これら情報(タイトル,記述,およびいくつかのタグ)は,ユーザが問題を投稿時に入力する必要がある必須情報である。DUPPREDICTORをトピックモデルを用いて各質問の潜在的課題を計算する。,質問の各対に対して,タイトル,記述,潜在的課題,およびタグを比較することによって四類似性スコアを計算する。これら四つの類似性スコアは最終的に一緒に組み合わせた複数の因子を考慮した包括的に新しい類似性スコアを生じた。DUPPREDICTORの利点を調べるために,二以上の百万質問を含むスタックオーバーフローデータセット上で実験を行った。結果はDUPPREDICTORは63.8%の想起rate@20スコアを達成できることを示した。スタックオーバーフローの標準検索エンジンを用いて提案アプローチを比較し,DUPPREDICTORはその想起rate@10スコアを40.63%改善した。Data from the ScienceChina, LCAS. Translated by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
物質索引 (1件):
物質索引
文献のテーマを表す化学物質のキーワードです
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る