文献
J-GLOBAL ID:201902237480254384   整理番号:19A1405248

概念辞書の類義語と分散表現を利用した教師なしall-words WSD

Unsupervised All-words WSD Using Synonyms and Embeddings
著者 (5件):
資料名:
巻: 26  号:ページ: 361-379  発行年: 2019年06月15日 
JST資料番号: L3934A  ISSN: 1340-7619  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
all-words語義曖昧性解消(以下all-words WSD(word sense disambiguation))とは文書中のすべての単語の語義ラベルを付与するタスクである.単語の語義は文脈,すなわち周辺の単語によって推定でき,周辺の単語同士が類似している場合中心の単語同士の語義も類似していると考える.そこで本研究では,対象単語とその類義語群から周辺単語の分散表現を作成し,ユークリッド距離を計算することで対象単語の語義を予測した.また,語義の予測結果をもとにコーパスを語義ラベル列に変換し,語義の分散表現を作成した.語義の分散表現を用いて周辺単語ベクトルを作成し直し,再び語義の予測を行った.コーパスには分類語彙表番号がアノテーションされた『現代日本語書き言葉均衡コーパス』(BCCWJ)を利用した.本研究では分類語彙表における分類番号を語義とし,類義語も分類語彙表から取得した.本研究では,提案手法とランダムベースライン,Pseudo Most Frequent Sense(PMFS),Yarowskyの手法,LDAWNを比較し,提案手法が勝ることを示した.(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
情報加工一般  ,  人工知能  ,  自然語処理 
引用文献 (20件):
  • Baldwin, T., Kim, S. N., Bond, F., Fujita, S., Martinez, D., and Tanaka, T. (2008).“MRD-based Word Sense Disambiguation: Further Extending Lesk.” In Proceedings of the 3rd International Joint Conference on Natural Language Processing (IJCNLP 2008), pp. 775-780.
  • Boyd-Graber, J., Blei, D., and Zhu, X. (2007).“A Topic Model for Word Sense Disambiguation.” In EMNLP-CoNLL-2007, pp. 1024-1033.
  • Gale, W. A., Church, K. W., and Yarowsky, D. (1992).“One Sense Per Discourse.” In Proceedings of the Workshop on Speech and Natural Language, HLT ’91, pp. 233-237, Stroudsburg, PA, USA. Association for Computational Linguistics.
  • Guo, W. and Diab, M. (2011).“Semantic Topic Models: Combining Word Distributional Statistics and Dictionary Definitions.” In Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing, pp. 552-561.
  • Kato, S., Asahara, M., and Yamazaki, M. (2018).“Annotation of ‘Word List by Semantic Principles’ Labels for Balanced Corpus of Contemporary Written Japanese.” In Proceedings of the 32nd Pacific Asia Conference on Language, Information and Computation (PACLIC 32).
もっと見る
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る